247
Поволжский Государственный Университет Телекоммуникаций и Информатики Факультет ИСТ Кафедра ИВТ Современные проблемы информатики и вычислительной техники Учебное пособие Автор: Акчурин Э.А. д.т.н., профессор Самара 2012г.

Современные проблемы информатики и вычислительной техники

  • Upload
    qball91

  • View
    376

  • Download
    28

Embed Size (px)

DESCRIPTION

Пособие по дисциплине "Современные проблемы информатики и вычислительной техники" направления 230100 - «Информатика и вычислительная техника».

Citation preview

Page 1: Современные проблемы информатики и вычислительной техники

Поволжский Государственный Университет Телекоммуникаций и Информатики

Факультет ИСТ

Кафедра ИВТ

Современные проблемы информатики и вычислительной техники

Учебное пособие

Автор: Акчурин Э.А. д.т.н., профессор

Самара

2012г.

Page 2: Современные проблемы информатики и вычислительной техники

2 `

Факультет информационных систем и технологий

Кафедра «Информатика и вычислительная техника»

Автор - д.т.н., профессор Акчурин Э.А.

Другие материалы по дисциплине Вы найдете на сайте

www.ivt.psuti.ru

Page 3: Современные проблемы информатики и вычислительной техники

3 `

Пособие по дисциплине " Современные проблемы информатики и вычислительной техники" направления 230100 – «Информатика и вычислительная техника»..

Рекомендуемая литература:

1. Белов А. Самоучитель разработчика устройств на микроконтроллерах AVR. НиТ, СПб – 2008, 544с. 2. Хартов В.Я. Микроконтроллеры AVR. Практикум для начинающих. - М.: Изд-во МГТУ им. Н.Э.

Баумана, 2007. – 240с. 3. Иванова В.Г., Тяжев А.И. Цифровая обработка сигналов и сигнальные процессоры. Самара: ООО

Офорт, 2008г., 262 с. 4. Микроконтроллеры семейства C2000. Texas Instruments. 2011г., 17 с. 5. Embedded Processing Guide. TI, 2009г., 129c 6. Blackfin_RUS. Analog Devices, 2012г., 65 с.

Page 4: Современные проблемы информатики и вычислительной техники

4 `

1 Интеллектуальные системы

1.1 Методы Data Mining

Data Mining (добыча данных, интеллектуальный анализ данных, глубинный анализ данных) — собирательное название, используемое для обозначения совокупности методов обнаружения в данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности. Термин введён Григорием Пятецким-Шапиро в 1989г.

Английское словосочетание «Data Mining» пока не имеет устоявшегося перевода на русский язык. При передаче на русском языке используются словосочетания: просев информации, добыча данных, извлечение данных, а, также, интеллектуальный анализ данных. Более полным и точным является словосочетание «обнаружение знаний в базах данных».

Основу Data Mining составляют всевозможные методы классификации, моделирования и прогнозирования, основанные на применении:

деревьев решений,

искусственных нейронных сетей,

генетических алгоритмов,

эволюционного программирования,

ассоциативной памяти,

нечёткой логики.

К методам Data Mining нередко относят статистические методы

дескриптивный анализ,

корреляционный и регрессионный анализ,

факторный анализ, дисперсионный анализ,

компонентный анализ,

дискриминантный анализ,

анализ временных рядов.

Такие методы, однако, предполагают некоторые априорные представления об анализируемых данных, что несколько расходится с целями Data Mining (обнаружение ранее неизвестных нетривиальных и практически полезных знаний).

Одно из важнейших назначений методов Data Mining состоит в наглядном представлении результатов вычислений, что позволяет использовать инструментарий Data Mining людьми, не имеющих специальной математической подготовки. В то же время, применение статистических методов анализа данных требует хорошего владения теорией вероятностей и математической статистикой.

1.1.1 Искусственные нейронные сети

Искусственные нейронные сети (ИНС) — математические модели, а также их программные или аппаратные реализации, построенные по принципу организации и функционирования биологических нейронных сетей — сетей нервных клеток живого организма. Это понятие возникло при изучении процессов, протекающих в мозге, и при попытке смоделировать эти процессы. Первой такой попыткой были нейронные сети Маккалока и Питтса. После разработки алгоритмов обучения, получаемые модели стали использовать в практических целях: в задачах прогнозирования, для распознавания образов, в задачах управления и др.

ИНС представляют собой систему соединённых и взаимодействующих между собой простых процессоров (искусственных нейронов). Такие процессоры обычно довольно просты, особенно в сравнении с процессорами, используемыми в персональных компьютерах. Каждый процессор подобной сети имеет дело только с сигналами, которые он периодически получает, и сигналами, которые он периодически посылает другим процессорам. И тем не менее, будучи соединёнными в достаточно

Page 5: Современные проблемы информатики и вычислительной техники

5 `

большую сеть с управляемым взаимодействием, такие локально простые процессоры вместе способны выполнять довольно сложные задачи.

С точки зрения машинного обучения, нейронная сеть представляет собой частный случай методов распознавания образов, дискриминантного анализа, методов кластеризации и т. п.

С математической точки зрения, обучение нейронных сетей — это многопараметрическая задача нелинейной оптимизации.

С точки зрения кибернетики, нейронная сеть используется в задачах адаптивного управления и как алгоритмы для робототехники.

С точки зрения развития вычислительной техники и программирования, нейронная сеть — способ решения проблемы эффективного параллелизма.

А с точки зрения искусственного интеллекта, ИНС является основой философского течения коннективизма и основным направлением в структурном подходе по изучению возможности построения (моделирования) естественного интеллекта с помощью компьютерных алгоритмов.

Нейронные сети не программируются в привычном смысле этого слова, они обучаются. Возможность обучения — одно из главных преимуществ нейронных сетей перед традиционными алгоритмами. Технически обучение заключается в нахождении коэффициентов связей между нейронами. В процессе обучения нейронная сеть способна выявлять сложные зависимости между входными данными и выходными, а также выполнять обобщение. Это значит, что в случае успешного обучения сеть сможет вернуть верный результат на основании данных, которые отсутствовали в обучающей выборке, а также неполных и/или «зашумленных», частично искаженных данных.

Особый интерес ученых и разработчиков сложных управляющих систем к нейросетевым технологиям, как и к другим технологиям ИИ, возник в начале 1980-х (известный ≪японский вызов≫), когда остро встала проблема сверхвысокой производительности вычислительных средств.

В основе стратегий ИИ лежит понятие парадигмы — взгляда (концептуального представления) на суть проблемы или задачи и принцип ее решения. Рассматривают две парадигмы искусственного интеллекта.

Парадигма эксперта предполагает следующие объекты, а также этапы разработки и функционирования системы ИИ:

формализация знаний — преобразование экспертом проблемного знания в форму, предписанную выбранной моделью представления знаний;

формирование базы знаний (БЗ) - вложение формализованных знаний в программную систему;

дедукция — решение задачи логического вывода на основе БЗ.

Эта парадигма лежит в основе применения экспертных систем, систем логического вывода, в том числе на языке логического программирования ПРОЛОГ. Считается, что системы на основе этой парадигмы более изучены.

Парадигма ученика, включающая следующие положения и последовательность действий:

Обработка наблюдений, изучение опыта частных примеров — формирование базы данных (БД) системы ИИ.

Индуктивное обучение — превращение БД в БЗ на основе обобщения знаний, накопленных в БД, и обоснование процедуры извлечения знаний из БЗ. Это означает, что на основе данных делается вывод об общности той зависимости между объектами, которую мы наблюдаем. Основное внимание здесь уделяется изучению аппроксимирующих, вероятностных и логических механизмов получения общих выводов из частных утверждений. Затем мы можем обосновать, например, достаточность процедуры обобщенной интерполяции (экстраполяции), или процедуры ассоциативного поиска, с помощью которой будем удовлетворять запросы к БЗ.

Дедукция — по обоснованной или предполагаемой процедуре мы выбираем информацию из БЗ по запросу (например, оптимальную стратегию управления по вектору, характеризующему сложившуюся ситуацию).

Page 6: Современные проблемы информатики и вычислительной техники

6 `

Исследования в рамках этой парадигмы и ее разработка проведены пока слабо, хотя они лежат в основе построения самообучающихся систем управления (ниже будет приведен замечательный пример самообучающейся системы управления — правила стрельбы в артиллерии).

Чем база знаний, общий и обязательный элемент системы ИИ, отличается от базы данных? Возможностью логического вывода!

Теперь отбросив мистику, мы признаем, что мозг представляет собой нейронную сеть, нейросеть, - нейроны, соединенные между собой, со многими входами и единственным выходом каждый.

Нейрон реализует достаточно простую передаточную функцию, позволяющую преобразовать возбуждения на входах, с учетом весов входов, в значение возбуждения на выходе нейрона. Функционально законченный фрагмент мозга имеет входной слой нейронов — рецепторов, возбуждаемых извне, и выходной слой, нейроны которого возбуждаются в зависимости от конфигурации и величины возбуждения нейронов входного слоя. Предполагается, что нейросеть, имитирующая работу мозга, обрабатывает не сами данные, а их достоверность, или, в общепринятом смысле, вес, оценку этих данных. Для большинства непрерывных или дискретных данных их задание сводится к указанию вероятности диапазонов, которым принадлежат их значения. Для большого класса дискретных данных — элементов множеств — целесообразно жесткое закрепление нейронов входного слоя.

Распределение величин возбуждения нейронов выходного слоя, а чаще всего нейрон, обладающий максимальной величиной возбуждения, позволяют установить соответствие между комбинацией и величинами возбуждений на входном слое (изображение на сетчатке глаза) и получаемым ответом (что

это). Таким образом, эта зависимость и определяет возможность логического вывода вида ≪если — то≫. Управление, формирование данной зависимости осуществляются весами синапсических связей нейронов, которые влияют на направления распространения возбуждения нейронов в сети, приводящие

на этапе обучения к ≪нужным≫ нейронам выходного слоя, т.е. служат связыванию и запоминанию отношений ≪посылка — следствие≫. Связь подструктур нейросети позволяет получать ≪длинные≫ логические цепочки на основе подобных отношений.

Отсюда следует, что сеть работает в двух режимах: в режиме обучения и в режиме распознавания (рабочем режиме). В режиме обучения производится формирование логических цепочек. В режиме распознавания нейросеть по предъявляемому образу с высокой достоверностью определяет, к какому типу он относится, какие действия следует предпринять и т.д.

Считается, что в человеческом мозге до 100 млрд. нейронов. Но сейчас нас не интересует, как устроен нейрон, в котором насчитывают до 240 химических реакций. Нас интересует, как работает нейрон на логическом уровне, как выполняет он логические функции. Реализация лишь этих функций должна стать основой и средством искусственного интеллекта. Воплощая эти логические функции, мы готовы нарушить основные законы физики, например закон сохранения энергии. Ведь мы рассчитываем не на физическое моделирование, а на доступное, универсальное — компьютерное.

Итак, мы сосредоточиваем внимание на ≪прямом≫ использовании нейросетей в задачах искусственного интеллекта. Однако их применение распространяется на решение и других задач. Для этого строят нейросетевые модели со структурой, ориентированной на данную задачу, используют специальную систему связей нейроподобных элементов, определенный вид передаточной функции (часто используют так называемые сигмоидные связи, основанные на участии экспоненты при формировании передаточной функции), специально подобранные и динамически уточняемые веса. При этом используют свойства сходимости величин возбуждения нейронов, самооптимизации. При подаче входного вектора возбуждений через определенное число тактов работы нейросети значения возбуждения нейронов выходного слоя (в некоторых моделях все нейроны входного слоя являются нейронами выходного слоя и других нет) сходятся к неким величинам. Они могут указывать, например, на

то, какой эталон в большей степени похож на ≪зашумленный≫, недостоверный входной образ, или на то, как найти решение некоторой задачи.

Например, известная сеть Хопфилда, хоть и с ограничениями, может решать задачу коммивояжера - задачу экспоненциальной сложности. Сеть Хемминга успешно реализует ассоциативную память. Сети Кохонена (карты Кохонена) эффективно используют принцип кластеризации и широко применяются в

Page 7: Современные проблемы информатики и вычислительной техники

7 `

экономике, финансах, бизнесе и т.д. Эффективно применяются нейросети для аппроксимации функций многих переменных в виде рекурсивного разложения в базисе передаточной функции.

В указанном выше применении нейросети выступают в роли спецпроцессоров для ≪быстрого≫ решения частных задач или классов задач. Это можно сравнить с применением аналоговых ЭВМ для решения систем дифференциальных уравнений, где программирование заключается в формировании электрической цепи из элементов заданного набора в соответствии с системой уравнений, а установившийся процесс позволяет на выходе снимать значения функций — решений.

Когда хотят подчеркнуть такие ≪вычислительные≫ применения нейросетей, то говорят о нейроподобных задачах, и это не должно отвлекать нас от действий в рамках ИИ, направленных на решение трудно формализуемых задач, на простоту и универсальность, свойственные мозгу.

1.1.2 Генетический алгоритм

Генетический алгоритм (ГА) — это эвристический алгоритм поиска, используемый для решения задач оптимизации и моделирования путём случайного подбора, комбинирования и вариации искомых параметров с использованием механизмов, напоминающих биологическую эволюцию.

Является разновидностью эволюционных вычислений, с помощью которых решаются оптимизационные задачи с использованием методов естественной эволюции, таких как наследование, мутации, отбор.

Отличительной особенностью генетического алгоритма является акцент на использование оператора «скрещивания», который производит операцию рекомбинации решений-кандидатов, роль которой аналогична роли скрещивания в живой природе.

Первые работы по симуляции эволюции были проведены в 1954г Баричелли на компьютере, установленном в Институте Продвинутых Исследований Принстонского университета. Его работа, опубликованная в том же году, привлекла широкое внимание общественности. С 1957г австралийский генетик Фразер опубликовал серию работ по симуляции искусственного отбора

Искусственная эволюция стала общепризнанным методом оптимизации после работы Рехенберга и Швефеля в 1960-х и начале 1970-х двадцатого века – группа Рехенберга смогла решить сложные инженерные проблемы согласно стратегиям эволюции.

Другим подходом была техника эволюционного программирования Фогеля, которая была предложена для создания искусственного интеллекта. Эволюционное программирование первоначально использовавшее конечные автоматы для предсказывания обстоятельств, и использовавшее разнообразие и отбор для оптимизации логики предсказания.

Генетические алгоритмы стали особенно популярны благодаря работе Холланда в начале 70-х годов и его книге «Адаптация в естественных и искусственных системах» (1975г). Его исследование основывалось на экспериментах с клеточными автоматами, проводившимися Холландом и на его трудах написанных в университете Мичигана. Холланд ввел формализованный подход для предсказывания качества следующего поколения, известный как Теорема схем. Исследования в области генетических алгоритмов оставались в основном теоретическими до середины 80-х, когда была наконец проведена Первая международная конференция по ГА в Питтсбурге (Пенсильвания, США).

С ростом исследовательского интереса существенно выросла и вычислительная мощь настольных компьютеров, это позволило использовать новую вычислительную технику на практике. В конце 80-х компания General Electric начала продажу первого в мире продукта, работавшего с использованием ГА. Им стал набор промышленных вычислительных средств. В 1989г другая компания Axcelis выпустила Evolver – первый в мире коммерческий продукт на ГА для настольных компьютеров.

Задача формализуется таким образом, чтобы её решение могло быть закодировано в виде вектора («генотипа») генов, где каждый ген может быть битом, числом или неким другим объектом. В классических реализациях ГА предполагается, что генотип имеет фиксированную длину. Однако существуют вариации ГА, свободные от этого ограничения.

Некоторым, обычно случайным, образом создаётся множество генотипов начальной популяции. Они оцениваются с использованием «функции приспособленности», в результате чего с каждым генотипом

Page 8: Современные проблемы информатики и вычислительной техники

8 `

ассоциируется определённое значение («приспособленность»), которое определяет насколько хорошо фенотип, им описываемый, решает поставленную задачу.

При выборе «функции приспособленности» (fitness function в англоязычной литературе) важно следить, чтобы её «рельеф» был «гладким».

Из полученного множества решений («поколения») с учётом значения «приспособленности» выбираются решения (обычно лучшие особи имеют большую вероятность быть выбранными), к которым применяются ГА, в большинстве случаев «скрещивание» (crossover) и «мутация» (mutation), результатом чего является получение новых решений. Для них также вычисляется значение приспособленности, и затем производится отбор («селекция») лучших решений в следующее поколение.

Этот набор действий повторяется итеративно, так моделируется «эволюционный процесс», продолжающийся несколько жизненных циклов (поколений), пока не будет выполнен критерий остановки алгоритма. Таким критерием может быть:

нахождение глобального, либо субоптимального решения;

исчерпание числа поколений, отпущенных на эволюцию;

исчерпание времени, отпущенного на эволюцию.

ГА служат, главным образом, для поиска решений в многомерных пространствах поиска.

Таким образом, можно выделить следующие этапы ГА:

Задать целевую функцию (приспособленности) для особей популяции.

Создать начальную популяцию.

Цикл: Размножение (скрещивание). Мутирование. Вычислить значение целевой функции для всех особей. Формирование нового поколения (селекция). Если выполняются условия остановки, то (конец цикла), иначе (начало цикла).

Схема работы генетического алгоритма

Page 9: Современные проблемы информатики и вычислительной техники

9 `

Создание начальной популяции.

Перед первым шагом нужно случайным образом создать начальную популяцию; даже если она окажется совершенно неконкурентоспособной, вероятно, что генетический алгоритм все равно достаточно быстро переведет ее в жизнеспособную популяцию. Таким образом, на первом шаге можно особенно не стараться сделать слишком уж приспособленных особей, достаточно, чтобы они соответствовали формату особей популяции, и на них можно было подсчитать функцию приспособленности (Fitness). Итогом первого шага является популяция H, состоящая из N особей.

Размножение (Скрещивание).

Размножение в генетических алгоритмах обычно половое — чтобы произвести потомка, нужны несколько родителей, обычно два.

Размножение в разных алгоритмах определяется по-разному — оно, конечно, зависит от представления данных. Главное требование к размножению — чтобы потомок или потомки имели возможность унаследовать черты обоих родителей, «смешав» их каким-либо способом.

Почему особи для размножения обычно выбираются из всей популяции H, а не из выживших на первом шаге элементов H0 (хотя последний вариант тоже имеет право на существование)? Дело в том, что главный бич многих генетических алгоритмов — недостаток разнообразия в особях. Достаточно быстро выделяется один-единственный генотип, который представляет собой локальный максимум, а затем все элементы популяции проигрывают ему отбор, и вся популяция «забивается» копиями этой особи. Есть разные способы борьбы с таким нежелательным эффектом; один из них — выбор для размножения не самых приспособленных, но вообще всех особей.

Мутации.

К мутациям относится все то же самое, что и к размножению: есть некоторая доля мутантов m, являющаяся параметром генетического алгоритма, и на шаге мутаций нужно выбрать mN особей, а затем изменить их в соответствии с заранее определёнными операциями мутации.

Page 10: Современные проблемы информатики и вычислительной техники

10 `

Отбор

На этапе отбора нужно из всей популяции выбрать определённую её долю, которая останется «в живых» на этом этапе эволюции. Есть разные способы проводить отбор. Вероятность выживания особи h должна зависеть от значения функции приспособленности Fitness(h). Сама доля выживших s обычно является параметром генетического алгоритма, и её просто задают заранее. По итогам отбора из N особей популяции H должны остаться sN особей, которые войдут в итоговую популяцию H'. Остальные особи погибают.

Генетические алгоритмы применяются для решения следующих задач:

Оптимизация функций.

Оптимизация запросов в базах данных.

Разнообразные задачи на графах (задача коммивояжера, раскраска, нахождение паросочетаний).

Настройка и обучение искусственной нейронной сети.

Задачи компоновки.

Составление расписаний.

Игровые стратегии.

Теория приближений.

Искусственная жизнь.

Биоинформатика.

1.1.3 Эволюционное программирование

Эволюционное программирование было изобретено Фогелем в Национальном Научном Фонде в 1960г. Ему было поручено представить доклад Конгрессу США на сумму инвестиций в фундаментальные исследования. Одним из вопросов рассмотрения был искусственный интеллект ИИ).

В то время ИИ был ограничен двумя основными направлениями исследований: моделированием человеческого мозга (нейронные сети) и моделированием решения проблем поведения человека (эвристическое программирование). Альтернативный вариант, предусмотренный Фогелем, должен был отказаться от моделирования конечного продукта эволюции, и, скорее, моделировать процесс эволюции, используя себя в качестве транспортного средства для получения разумного поведения.

Фогель рассматривает интеллект как составную часть способности делать предсказания окружающей среды в сочетании с переводом каждого прогноза в подходящий ответ в свете заданной цели (например, для максимизации функции выигрыша). Таким образом, по его мнению, прогнозирование является необходимым условием для разумного поведения. Моделирование эволюции как оптимизации процесса явилось следствием опыта Фогеля в новых областях «биотехнологии», кибернетики и техники. Фогель провел серию экспериментов, в которых автоматы представляли отдельные организмы. Автоматы - это графические модели, используемые для описания поведения или программного обеспечения и аппаратных средств, поэтому он назвал свой подход эволюционным программированием.

В 1964 году Фогель получил докторскую степень в области электротехники в университете Калифорнии в Лос-Анджелесе. Его диссертация «О происхождении Интеллекта», была посвящена ИИ путем имитации эволюции. Ранние работы также привели Фогеля, Оуэнса и Уолша к созданию решений для для компании Science в 1965г. Это была первая компания в мире, занимавшаяся исключительно коммерциализацией эволюционных алгоритмов.

В 1970г, благодаря в первую очередь руководству Дэрхольта в государственном университете Нью-Мехико, было опубликовано более широкое исследование вычислений для эволюционного программирования, чем для любых других форм моделируемой эволюции. Большинство этих исследований использовали эволюционные программы для распознавания образов.

В качестве примера для распознавания использовались главным образом рукописные символы. В эксперименты включили параметры адаптивных мутаций. Работа Атмара (1976г) — один из ранних примеров имитации эволюции в обстановке искусственной жизни. Атмар первый предложил и описал, как эволюционное программирование может быть рассчитано на то, что сейчас известно как «расширенная база оборудования».

Page 11: Современные проблемы информатики и вычислительной техники

11 `

Гипотезы о виде зависимости целевой переменной от других переменных формулируются системой в виде программ на некотором внутреннем языке программирования. Если это универсальный язык, то теоретически на нем можно выразить зависимость любого вида. Процесс построения таких программ строится как эволюция в мире программ (этим метод немного похож на ГА). Если система находит программу, которая точно выражает искомую зависимость, она начинает вносить в нее небольшие модификации и отбирает среди построенных таким образом дочерних программ те, которые повышают точность.

Система "выращивает" несколько генетических линий программ, конкурирующих между собой в точности нахождения искомой зависимости. Специальный транслирующий модуль переводит найденные зависимости с внутреннего языка системы на понятный пользователю язык (математические формулы, таблицы и др.), делая их легкодоступными. Для того, чтобы сделать полученные результаты более понятными для не математика, существует большой арсенал разнообразных средств визуализации выявленных зависимостей.

Поиск зависимости целевых переменных от других проводится в форме функций какого-нибудь определенного вида. Например, в одном из наиболее удачных алгоритмов этого типа - методе группового учета аргументов (МГУА) зависимость ищут в форме полиномов. Причем сложные полиномы заменяются несколькими простыми, учитывающими лишь некоторые признаки (группы аргументов). Обычно используются попарные объединения признаков. Этот метод не имеет больших преимуществ по сравнению с нейронными сетями с готовым набором стандартных нелинейных функций, но, полученные формулы зависимости, в принципе, поддаются анализу и интерпретации (хотя на практике это все-таки сложно).

Области применения.

Эволюционное программирование было применено к различным инженерным задачам, включая маршрутизацию трафика и планирование, системы управления (Чон, 1997г), системы идентификации (Фогель, 1990г), обработки сигналов (Порто, 1990г), энергетика (Лай Ма, 1996г), обучение в играх (Фогель и Бургин, 1969г) и т. д.

1.1.4 Нечёткая логика

Нечёткая логика (НЛ) - теория нечётких множеств — раздел математики, являющийся обобщением классической логики и теории множеств.

Понятие НЛ было впервые введено Заде в 1965г. В его статье понятие множества было расширено допущением, что функция принадлежности элемента к множеству может принимать любые значения в интервале [0...1], а не только 0 или 1. Такие множества были названы нечёткими. Также автором были предложены различные логические операции над нечёткими множествами и предложено понятие лингвистической переменной, в качестве значений которой выступают нечёткие множества.

В настоящее время существуют по крайней мере 2 основных направления научных исследований в области НЛ:

НЛ в широком смысле (теория приближенных вычислений);

НЛ в узком смысле (символическая нечёткая логика).

Символическая нечёткая логика основывается на понятии t-нормы. После выбора некоторой t-нормы (а её можно ввести несколькими разными способами) появляется возможность определить основные операции над пропозициональными переменными: конъюнкцию, дизъюнкцию, импликацию, отрицание и другие.

Нетрудно доказать теорему о том, что дистрибутивность, присутствующая в классической логике, выполняется только в случае, когда в качестве t-нормы выбирается t-норма Гёделя.

Кроме того, в силу определенных причин, в качестве импликации чаще всего выбирают операцию, называемую residium (она, вообще говоря, также зависит от выбора t-нормы).

Page 12: Современные проблемы информатики и вычислительной техники

12 `

Определение основных операций, перечисленных выше, приводит к формальному определению базисной нечёткой логики, которая имеет много общего с классической булевой логикой (точнее, с исчислением высказываний).

Существуют 3 основных базисных нечётких логик: логика Лукасевича, логика Гёделя и вероятностная логика. Интересно, что объединение любых 2 из 3 перечисленных выше логик приводит к классической булевой логике.

Теория приближенных вычислений.

Основное понятие НЛ в широком смысле — нечёткое множество, определяемое при помощи обобщенного понятия характеристической функции. Затем вводятся понятия объединения, пересечения и дополнения множеств (через характеристическую функцию; задать можно различными способами), понятие нечёткого отношения, а также одно из важнейших понятий — понятие лингвистической переменной.

Вообще говоря, даже такой минимальный набор определений позволяет использовать НЛ в некоторых приложениях, для большинства же необходимо задать ещё и правило вывода (и оператор импликации).

Нечеткая логика и нейронные сети.

Поскольку нечеткие множества описываются функциями принадлежности, а t-нормы и k-нормы обычными математическими операциями, можно представить нечеткие логические рассуждения в виде нейронной сети. Для этого функции принадлежности надо интерпретировать как функции активации нейронов, передачу сигналов как связи, а логические t-нормы и k-нормы, как специальные виды нейронов, выполняющие математические соответствующие операции. Существует большое разнообразие подобных нейро-нечетких сетей. Например, ANFIS (Adaptive Neuro fuzzy Inference System) - адаптивная нейро-нечеткая система вывода.

Page 13: Современные проблемы информатики и вычислительной техники

13 `

1.1.5 Метаданные

Метаданные, в общем случае, это:

Метаданные — это субканальная информация об используемых данных.

Структурированные данные, представляющие собой характеристики описываемых сущностей для целей их идентификации, поиска, оценки, управления ими. Это набор допустимых структурированных описаний, которые доступны в явном виде и предназначение которых может помочь найти объект. Термин используется в контексте поиска объектов, сущностей, ресурсов.

Данные из более общей формальной системы, описывающей заданную систему данных.

Информация о содержащейся на веб-странице информации (создателе и т. п.). Пример: Имя автора правки в тексте. Этот термин в широком смысле слова используется для любой информации о данных: именах таблиц, колонок в таблице в реляционных базах данных, номер версии в файле программы (то есть как информативная часть в бинарном файле) и т. п.

Иерархии метаданных.

Структурированные в виде иерархии метаданные более правильно называть онтологией или схемой метаданных (например, XML-схема).

Различие между данными и метаданными.

Обычно невозможно провести однозначное разделение на данные и метаданные в документе, поскольку:

Что-то может являться как данными, так и метаданными. Так, заголовок статьи можно одновременно отнести как к метаданным (как элемент метаданных — заголовок), так и к собственно данным (поскольку заголовок является частью самого текста).

Данные и метаданные могут меняться ролями. На стихотворение, рассматриваемое как данные, может быть написана музыка, в этом случае всё стихотворение может быть «прикреплено» к музыкальному файлу и в этом случае рассматриваться как метаданные. Таким образом, отнесение к одной или другой категории зависит от точки зрения (или пространства имён, системы отсчёта).

Возможно создание мета-мета-…-метаданных (см. аксиома выбора). Поскольку, в соответствии с обычным определением, метаданные являются данными, то можно создать метаданные на метаданные, метаданныения для вывода на специальные устройства, либо чтения их описания с использованием программного обеспечения, преобразующего текст в речь.

Другие описательные метаданные могут использоваться автоматизированными рабочими потоками. Например, если некоторая «умная» программа «знает» содержимое и структуру данных, то данные могут быть автоматически преобразованы и переданы другой «умной» программе как входные данные. В результате, пользователи будут спасены от необходимости выполнения множества рутинных операций, если данные предоставлены для работы такими «немногословным» программам.

Метаданные становятся важны в World Wide Web по причине необходимости обеспечения поиска полезной информации среди огромного количества доступной. Метаданные, созданные вручную, имеют большую ценность, поскольку это гарантирует осмысленность. Если веб-страница на какую-то определённую тему содержит слово или фразу, то все другие веб-страницы на эту тему могут содержать такое же слово или фразу. Метаданные также обладают разнообразием, поэтому если с какой-то темой связаны два значения, то каждое из них может быть использовано. Например, статья про Живой Журнал может быть обозначена с помощью нескольких значений: «Живой Журнал», «ЖЖ», «LiveJournal».

Метаданные используются для хранения информации о записях audio CD. Аналогично MP3 файлы хранят метаданные в формате ID3.

Редактировать метаданные графических файлов можно в специальных программах для работы с метаданными.

Метаданные можно классифицировать по:

Page 14: Современные проблемы информатики и вычислительной техники

14 `

Содержанию. Метаданные могут либо описывать сам ресурс (например, название и размер файла), либо содержимое ресурса (например, «в этом видеофайле показано как парень играет в футбол»).

По отношению к ресурсу в целом. Метаданные могут относиться к ресурсу в целом или к его частям. Например, «Title» (название фильма) относится к фильму в целом, а «Scene description» (описание эпизода фильма) отдельное для каждого эпизода фильма.

По возможности логического вывода. Метаданные можно подразделить на три слоя: нижний слой — это «сырые» данные сами по себе; средний слой — метаданные, описывающие эти данные; и верхний слой — метаданные, которые позволяют делать логический вывод, используя второй слой.

Формат метаданных — представляет собой стандарт, предназначенный для формального описания некоторой категории ресурсов (объектов, сущностей и т. п.). Такой стандарт обычно включает в себя набор полей (атрибутов, свойств, элементов метаданных), позволяющих характеризовать рассматриваемый объект. Например, формат MARC позволяет описывать книги (и не только книги), содержит поля для описания названия, автора, тематики и огромного множества других характеристик (формат MARC позволяет описать сотни характеристик).

Форматы можно классифицировать, во-первых, по охвату и подробности типов описываемых ресурсов. Во-вторых, по ширине и подробности области описания ресурсов и мощности структуры элементов метаданных. Кроме этого, можно классифицировать по предметным областям, или целям разработки и использования формата метаданных.

Форматы метаданных часто разрабатываются международными организациями или консорциумами, включающими в себя заинтересованные в появлении стандарта государственные организации и частные компании. Разработанный формат часто закрепляется как стандарт в одной или нескольких организациях, занимающихся разработкой и принятием стандартов (например, W3C, ISO, ANSI и т. п.)

Классификация форматов метаданных по описываемой предметной области:

DCMI является одним из наиболее распространённых в интернет форматов метаданных для описания ресурсов любого типа (как электронных документов, так и реальных физических объектов). Другие форматы метаданных, предназначенные для описания архивов и электронных ресурсов GILS, EAD.

Для описания персон и организаций vCard и FOAF

Для описания библиографических ресурсов.

Для описания музейных и исторических ценностей используется формат CDWA

Для описания издательской продукции используются PRISM и ONIX

Для работы с изображениями со спутников VICAR

Для описания новостей NewsXML

1.1.6 Онтология

Онтология (в информатике) — это попытка всеобъемлющей и детальной формализации некоторой области знаний с помощью концептуальной схемы. Обычно такая схема состоит из структуры данных, содержащей все релевантные классы объектов, их связи и правила (теоремы, ограничения), принятые в этой области. Этот термин в информатике является производным от древнего философского понятия «онтология».

Онтологии используются в процессе программирования как форма представления знаний о реальном мире или его части. Основные сферы применения — моделирование бизнес-процессов, семантическая паутина, искусственный интеллект.

Элементы онтологий. Современные онтологии строятся по большей части одинаково, независимо от языка написания. Обычно они состоят из экземпляров, понятий, атрибутов и отношений.

Экземпляры — это основные, нижнеуровневые компоненты онтологии. Экземпляры могут представлять собой как физические объекты (люди, дома, планеты), так и абстрактные (числа, слова). Строго говоря, онтология может обойтись и без конкретных объектов. Однако, одной из главных целей онтологии является классификация таких объектов, поэтому они также включаются.

Page 15: Современные проблемы информатики и вычислительной техники

15 `

Понятия или классы — абстрактные группы, коллекции или наборы объектов. Они могут включать в себя экземпляры, другие классы, либо же сочетания и того, и другого. Примеры: Понятие «люди», вложенное понятие «человек». Чем является «человек» — вложенным

понятием, или экземпляром (индивидом) — зависит от онтологии. Понятие «индивиды», экземпляр «индивид».

Атрибуты. Объекты в онтологии могут иметь атрибуты. Каждый атрибут имеет по крайней мере имя и значение и используется для хранения информации, которая специфична для объекта и привязана к нему. Например, объект Ford Explorer имеет такие атрибуты, как: Название: Ford Explorer. Число-дверей: 4. Двигатель: {4.0Л, 4.6Л}. Коробка-передач: 6-ступенчатая.

Значение атрибута может быть сложным типом данных. В данном примере значение атрибута, который называется Двигатель, является списком значений простых типов данных.

Отношения. Важная роль атрибутов заключается в том, чтобы определять отношения (зависимости) между объектами онтологии. Обычно отношением является атрибут, значением которого является другой объект.

Предположим, что в онтологии автомобилей присутствует два объекта — автомобиль Ford Explorer и Ford Bronco. Пусть Bronco — это модель-наследник Explorer, тогда отношение между Ford Explorer и Ford Bronco определим как атрибут «isSuccessorOf» со значением «Explorer» для объекта Bronco (следует заметить, что в языках описания онтологий существуют предопределенные отношения наследования).

Специализированные и общие онтологии.

Специализированные (предметно-ориентированные) онтологии — это представление какой-либо области знаний или части реального мира. В такой онтологии содержатся специальные для этой области значения терминов. К примеру, слово «поле»:

в сельском хозяйстве означает участок земли,

в физике — один из видов материи,

в математике — класс алгебраических систем.

Общие онтологии используются для представления понятий, общих для большого числа областей. Такие онтологии содержат базовый набор терминов, глоссарий или тезаурус, используемый для описания терминов предметных областей.

Если использующая специализированные онтологии система развивается, то может потребоваться их объединение. Подзадачей объединения онтологий является задача отображения онтологий. И для инженера по онтологиям это серьёзные задачи. Онтологии даже близких областей могут быть несовместимы друг с другом. Разница может появляться из-за особенностей местной культуры, идеологии или вследствие использования другого языка описания. Объединение онтологий выполняют как вручную, так и в полуавтоматическом режиме. В целом это - трудоёмкий, медленный и дорогостоящий процесс. Использование базисной онтологии — единого глоссария — несколько упрощает эту работу. Есть научные работы по технологиям объединения, но они по большей части теоретические.

1.2 Синергетика

Синергетика — новое научное междисциплинарное направление, основанное профессором Штутгартского университета Г.Хакеном, которое занимается изучением систем, состоящих из многих подсистем различной природы и имеющих свойства, которыми не обладали подсистемы. Слово синергетика переводится как "энергия совместного действия" (от греческого: со — совместно, эргос — действие).

Синергетика представляет собой новую обобщающую науку, изучающую основные законы самоорганизации сложных систем. (математические модели явлений самоорганизации). Ее составными

Page 16: Современные проблемы информатики и вычислительной техники

16 `

частями являются такие понятия и предметные области как нелинейная динамика, хаос, фракталы, катастрофы, бифуркации и т.п. Растущая в наши дни популярность синергетики объясняется тем, что она становится языком междисциплинарного общения, на котором могут друг друга понимать специалисты по математике, физике, химии, биологии, психологии.

На вопрос: "Что такое синергетика?" можно дать несколько ответов [2].

Во-первых, буквальный. Речь идет о явлениях, которые возникают от совместного действия нескольких разных факторов, в то время как каждый фактор в отдельности к этому явлению не приводит.

Во-вторых, синергетику часто определяют как науку о самоорганизации. Под самоорганизацией понимают самопроизвольное усложнение структуры системы при медленном и плавном изменении ее параметров. При этом самопроизвольно возникающие образования называют диссипативными структурами.

Можно дать третье определение: синергетика — наука о неожиданных явлениях. Это определение не противоречит, а дополняет предыдущие. Действительно, при медленном плавном и монотонном изменении параметров в системе в некоторый момент "вдруг" появляются автоколебания. Причина — потеря устойчивости.

Анализ причин и законов самоорганизации и составляет предмет синергетики.

Формирование и сохранение упорядоченности структур требуется при решении многих задач не только в естественных и технических науках, но также в экономике и социологии.

Одной из практических задач синергетики является использование в искусственных системах, создаваемых человеком, явлений самоорганизации, имеющихся в биологических системах.

Вопрос об оптимальной упорядоченности и организации особенно остро стоит при исследованиях глобальных проблем — энергетических, экологических, многих других, требующих привлечения огромных ресурсов. Здесь нет возможности искать ответ методом проб и ошибок, а "навязать" системе необходимое поведение очень трудно. Гораздо разумнее действовать, опираясь на знание внутренних свойств системы, законов ее развития. В такой ситуации значение законов самоорганизации, формирования упорядоченности в физических, биологических и других системах трудно переоценить.

Основой синергетики является теория динамических систем.

В классической математической физике исследуются задачи, связанные с решением линейных уравнений. Линейные модели описывают процессы, в которых при изменении внешних воздействий наблюдаются количественные, но не качественные изменения состояний.

Если же внешние воздействия велики, то обычно начинают играть существенную роль нелинейные эффекты. Синергетика и предназначена для исследования нелинейных моделей.

Возникновение синергетики было неоднозначно воспринято научным сообществом. Одни говорили о новой парадигме в естествознании, социальных и гуманитарных науках на базе кооперации фундаментальных наук и их методов. Другие не видели в синергетике ничего нового по сравнению с современной теорией нелинейных колебаний и волн. Третьи склонялись к мнению, что синергетика всего лишь объединяющий лозунг и ничего более, и высказывали недоумение по поводу нездорового, по их мнению, ажиотажа, вызванного новым направлением.

Столь широкий разброс мнений связан с некоторыми необычными особенностями синергетики и ее взаимосвязями с другими науками.

В отличие от наук, возникавших на стыке двух дисциплин, например, физической химии или химической физики, одна из которых предоставляет новой науке предмет, а другая — метод исследования, синергетика опирается на методы, одинаково приложимые к различным предметным областям, и изучает сложные ("многокомпонентные") системы безотносительно к их природе. Ясно, что ученый, который знакомится с синергетикой с позиции той науки, которой он занимается, прежде всего обращает внимание на те ее аспекты, которые наиболее близки основным идеям знакомой ему области знания. Что же касается отличий синергетики от наук "со стажем", то они остаются в тени. Между тем такие

Page 17: Современные проблемы информатики и вычислительной техники

17 `

отличия существуют. Синергетика обращает внимание на то, что при традиционном подходе остается за рамками рассмотрения. Например, термодинамика и теория информации изучают статику, тогда как для синергетики основной интерес представляет динамика. Неравновесные фазовые переходы синергетических систем, включающие в себя колебания, пространственно-временные структуры и хаос, отличаются несравненно бoльшим разнообразием, чем фазовые переходы систем, находящихся в состоянии теплового равновесия. В отличие от кибернетики, занимающейся разработкой алгоритмов и методов, позволяющих управлять системой так, чтобы та функционировала заданным образом, синергетика изучает самоорганизацию системы при произвольном изменении управляющих параметров. Самоорганизацией при этом назвают процесс, идущий за счёт внутренних стимулов, не требующий вмешательства внешних факторов, не принадлежащих системе. В отличие от теории динамических систем, которая игнорирует флуктуации в точках бифуркации, синергетика занимается изучением стохастической динамики во всей ее полноте в подпространстве зависящих от времени управляющих параметров.

Важная особенность синергетических систем состоит в том, что ими можно управлять извне, изменяя действующие на системы факторы. Например, скорость роста клеток можно регулировать извне, обрабатывая клетки различными химическими веществами. Параметры, описывающие действующие на систему факторы, называются управляющими.

Временнaя эволюция синергетических систем зависит от причин, которые не могут быть предсказаны с абсолютной точностью. Непредсказуемость поведения синергетических систем связана не только с неполнотой информации о состоянии их многочисленных подсистем (что заставляет ограничиваться вместо индивидуального описания каждой подсистемы описанием ансамблей подсистем) и неизбежными квантовыми флуктуациями, но и тем, что эволюция некоторых систем очень чувствительна к начальным условиям. Даже небольшое различие в начальных условиях в корне изменяет последующую эволюцию системы. Непредсказуемость эволюции синергетических систем получила название стохастичности.

В процессе временной эволюции синергетическая система, находящаяся в одном состоянии, переходит в новое состояние (старое состояние утрачивает устойчивость). При описании перехода из одного состояния в другое одни параметры состояния (быстрые переменные) можно выразить через другие (медленные переменные), которые называются параметрами порядка, в результате чего количество независимых переменных уменьшается. Возможность представления быстрых переменных в виде функций параметров порядка составляет содержание синергетического принципа подчинения. Например, если на местности имеется овраг, то самая низкая точка поверхности земли в окрестности оврага находится на его дне. Поэтому для нахождения этой точки существенны медленные переменные, или параметры порядка, описывающие "осевую" дна оврага, а быстрые переменные, описывающие склоны оврага, могут быть представлены как функции параметров порядка в силу принципа подчинения. Параметр порядка и принцип подчинения принадлежат к числу наиболее фундаментальных понятий синергетики.

1.3 CALS-технологии

CALS-технологии (Continuous Acquisition and Life cycle Support — непрерывная информационная поддержка поставок и жизненного цикла) — современный подход к проектированию и производству высокотехнологичной и наукоёмкой продукции.

CALS основаны на использовании компьютерной техники и современных информационных технологий на всех стадиях жизненного цикла изделия. За счет непрерывной информационной поддержки обеспечиваются единообразные способы управления процессами и взаимодействия всех участников этого цикла: заказчиков продукции, поставщиков/производителей продукции, эксплуатационного и ремонтного персонала. Информационная поддержка реализуется в соответствии с требованиями системы международных стандартов, регламентирующих правила указанного взаимодействия преимущественно посредством электронного обмена данными.

ИПИ (информационная поддержка процессов жизненного цикла изделий) — русскоязычный аналог понятия CALS.

Page 18: Современные проблемы информатики и вычислительной техники

18 `

Применение CALS-технологий позволяет существенно сократить объёмы проектных работ, так как описания многих составных частей оборудования, машин и систем, проектировавшихся ранее, хранятся в унифицированных форматах данных сетевых серверов, доступных любому пользователю технологий CALS.

Развитие CALS-технологий должно привести к появлению так называемых виртуальных производств, в которых процесс создания спецификаций с информацией для программно управляемого технологического оборудования, достаточной для изготовления изделия, может быть распределён во времени и пространстве между многими организационно-автономными проектными студиями. Среди несомненных достижений CALS-технологий следует отметить лёгкость распространения передовых проектных решений, возможность многократного воспроизведения частей проекта в новых разработках и др.

Построение открытых распределённых автоматизированных систем для проектирования и управления в промышленности составляет основу современных CALS-технологий. Главная проблема их построения — обеспечение единообразного описания и интерпретации данных, независимо от места и времени их получения в общей системе, имеющей масштабы вплоть до глобальных. Структура проектной, технологической и эксплуатационной документации, языки её представления должны быть стандартизированными. Тогда становится реальной успешная работа над общим проектом разных коллективов, разделённых во времени и пространстве и использующих разные CAD/CAM/CAE-системы. Одна и та же конструкторская документация может быть использована многократно в разных проектах, а одна и та же технологическая документация — адаптирована к разным производственным условиям, что позволяет существенно сократить и удешевить общий цикл проектирования и производства. Кроме того, упрощается эксплуатация систем.

Для обеспечения информационной интеграции CALS использует стандарты IGES и STEP в качестве форматов данных. В CALS входят также стандарты электронного обмена данными, электронной технической документации и руководства для усовершенствования процессов. В последние годы работа по созданию национальных CALS-стандартов проводится в России под эгидой ФСТЭК РФ. С этой целью создан Технический Комитет ТК431 «CALS-технологии», силами которого разработан ряд стандартов серии ГОСТ Р ИСО 10303, являющихся аутентичными переводами соответствующих международных стандартов (STEP).

В ряде источников данную аббревиатуру представляют, как Computer Aided Acquisition and Logistic Support. В 1985 году Министерство обороны США объявило планы создания глобальной автоматизированной системы электронного описания всех этапов проектирования, производства и эксплуатации продуктов военного назначения. За прошедшие годы CALS-технология получила широкое развитие в оборонной промышленности и военно-технической инфраструктуре Министерства обороны США. По имеющимся данным это позволило ускорить выполнение НИОКР на 30—40%, уменьшить затраты на закупку военной продукции на 30%, сократить сроки закупки ЗИП на 22%, а также в 9 раз сократить время на корректировку проектов.

Page 19: Современные проблемы информатики и вычислительной техники

19 `

2 Свободное ПО

2.1 Shareware

Shareware (share - «разделяемое» и software — «программное обеспечение»). Условно-бесплатное ПО. Обусловлено особенностями распространения таких программ.

Исторически слово обозначало программы, свободно распространявшиеся третьими лицами (например, в сборниках программ на компакт-дисках) и содержавшие в себе просьбу заплатить деньги автору программы. Однако с течением времени значение изменилось и говоря о shareware все чаще стали иметь в виду не свободное распространение (которого в наше время может и не быть — программа может быть доступна только с сайта производителя), а приемы, используемые авторами shareware-программ с целью побудить пользователя заплатить за бесплатно полученную им (но не бесплатную) программу.

Сейчас под shareware чаще всего понимают также тип, способ или метод распространения проприетарного ПО на рынке (то есть на пути к конечному пользователю), при котором испытателю предлагается ограниченная по возможностям (не полнофункциональная или демонстрационная версия), сроку действия или версия с встроенным блокиратором-напоминанием о необходимости оплаты использования программы. В лицензии также может быть оговорён запрет на коммерческое или профессиональное (не тестовое) её использование. Иногда незарегистрированная программа спустя некоторое время (например, 30 дней) прекращает запускаться. Иногда становится недоступной часть функций. Иногда функциональность остаётся в полном объёме, но пользователю время от времени показывается напоминание о том, что он пользуется незарегистрированной версией.

Основной способ распространения shareware-программ — это каталоги ПО или реклама в поисковых системах.

Россия занимает 2 место в мире по объёмам доходов от продаж условно-бесплатных программ от независимых производителей. Многие такие программы созданы в России и продаются в США, Германии и других странах. Это небольшая, но активно развивающаяся статья экспорта высокотехнологичных продуктов.

Многие из продуктов, созданных в России, не имеют русскоязычного интерфейса. Причиной считается обширный объём нарушений авторских прав обладателей прав на продажу ПО, использование кряков и бедность населения, делающая невозможным для российских пользователей платить за ПО. Это заставляет разработчиков отказываться от распространения таких программ в России и заниматься продажами в других странах.

2.2 Freeware

Freeware (free «бесплатное» и software — «программное обеспечение»). ПО, лицензионное соглашение которого не требует каких-либо выплат правообладателю. Freeware обычно распространяется в бинарном виде, без исходных кодов и является проприетарным ПО.

Важно отличать Freeware от свободного программного обеспечения, которое предоставляет каждому помимо права на использование ПО, право модификации и ряд других прав. Freeware может распространяться без исходных текстов и может содержать ограничения на коммерческое использование, модификацию и т. д.

В отличие от условно-бесплатного ПО (Shareware), Freeware не предполагает никакой платы разработчику и соответственно, никаких дополнительных услуг, таких как улучшенные версии, за эту плату не предполагается.

Существует также способ распространения ПО, занимающий среднее положение между shareware и классическим freeware, когда некая программа выпускается в двух вариантах: платная полная версия и бесплатная облегчённая, но при этом, в отличие от большинства shareware-программ, использование которых по окончании ознакомительного срока нелегально, здесь никаких ограничений по времени использования бесплатная версия не имеет, а ограничения накладываются на какие-либо

Page 20: Современные проблемы информатики и вычислительной техники

20 `

«продвинутые» возможности программы, а иногда также воспрещается её использование в особо оговоренных в EULA случаях (чаще всего — в коммерческих целях). Такова, например, бесплатная версия программы Micro-Cap, которую можно легально использовать в течение неограниченного времени, однако, у неё сильно сокращена библиотека моделируемых элементов, воспрещено использование в коммерческих целях, искусственно уменьшена скорость моделирования.

Многие тексты на тему программного обеспечения составляются на английском языке, в котором слова «свободный» и «бесплатный» переводятся одинаково, как free. Это создаёт путаницу в именовании. Так появился термин Freeware, а для именования свободного и открытого программного обеспечения — термин FLOSS (Free/Libre and Open Source Software). Однако, Фонд свободного ПО рекомендует именовать свободное программное обеспечение как free software.

2.3 Движение СПО

Движение СПО зародилось в 1983 году, когда Ричард Столлман сформировал идею о необходимости дать программную свободу (англ. software freedom) пользователям. В 1985 году Столлман основал Фонд свободного программного обеспечения, чтобы обеспечить организационную структуру для продвижения своей идеи.

Бизнес-модели СПО как правило основаны на принципе расширения возможностей — например, новые объекты применения, обучение, интеграция, настройка или сертификация. В то же время, некоторые бизнес-модели, которые работают с проприетарным программным обеспечением, не совместимы со свободным программным обеспечением, особенно те, которые заставляют пользователей платить за лицензию, чтобы законно использовать программный продукт.

2.4 Свободные лицензии

В соответствии с современным законодательством большинства стран, программный продукт и его исходный код охраняется авторским правом, которое даёт авторам и правообладателю (чаще всего правообладателем является организация-наниматель автора служебных произведений) власть над изменением, распространением, способом использования и поведением программы, включая случаи, когда исходный код опубликован. Сила власти авторских прав в современном обществе настолько велика, что даже изучение или попытки исправления ошибок программ путём дизассемблирования могут преследоваться уголовным правом.

Чтобы избавить пользователей программ от проблем, вызванных перекосом законодательства об охране результатов интеллектуальной деятельности в сторону правообладателя, авторы и правообладатели могут передать пользователям права на четыре вышеперечисленные свободы действий. Это достигается путём выпуска исходного кода программного обеспечения на условиях одной из особого рода лицензий, называемых свободными лицензиями. Несмотря на то, что по условиям свободных лицензий выданные пользователям разрешения правообладатель отозвать не может, свои права, гарантированные законодательством, авторы сохраняют.

Свободное ПО легко коммерциализируется — существует множество бизнес-моделей, где исключена необходимость оплаты копий программы. Например, высокую популярность имеет бизнес-модель, когда предприниматель может заработать за счёт предоставления услуг технической поддержки. Правообладателю свободного кода может быть интересен другой вариант — реализация программных продуктов на условиях коммерческой лицензии, в случае, если клиенту необходимо интегрировать свободный код в проприетарное программное обеспечение, но он не желает раскрытия своих разработок.

2.5 Разработка ПО как научное исследование

Особенность программного обеспечения состоит в том, что оно производится в одной форме — в виде исходного текста, а распространяется и используется часто в другой — в виде исполнимых программ, машинных кодов, по которым невозможно однозначно восстановить исходный текст. Чтобы эффективно изменять программу, исправлять ошибки или даже просто точно установить, что и как делает программа,

Page 21: Современные проблемы информатики и вычислительной техники

21 `

необходимо располагать её исходным текстом, поскольку при компиляции в машинный код программа утрачивает удобочитаемость.

Первоначально создание программного обеспечения для компьютеров было в первую очередь академическим занятием. Для специалистов в области компьютерной науки каждая программа представляла собой результат научного исследования, в некотором смысле аналогичный публикации статьи. Это означает, что исходный текст программы был обязательно доступен всему научному сообществу, поскольку любой научный результат должен быть верифицируем, то есть подтверждаться другими исследователями и быть открытым для критики. Таким образом, процесс разработки программного обеспечения более принципиально схож с научным процессом: учёный брал существующие программы, исправлял их в соответствии со своими идеями и публиковал исправленные программы — новый результат.

Однако технология производства компьютеров развивалась не менее активно, чем программное обеспечение для них. В 1970-е годы существовало огромное разнообразие различных архитектур вычислительных машин, различавшихся также производительностью и ценой. Естественно, для каждой архитектуры приходилось разрабатывать отдельный набор программного обеспечения. С середины 1970-х в большинстве американских университетов для академических разработок использовались компьютеры архитектуры PDP-10, что позволяло сотрудникам разных университетов использовать разработки друг друга на своих машинах. Сотрудники лаборатории искусственного интеллекта Массачусетского технологического института (MIT) в конце 1970-х разработали для PDP-10 собственную операционную систему ITS (Incompatible Timesharing System — несовместимая система с разделением времени) и очень большой набор программ для неё. Исходные тексты написанных в MIT программ были общедоступны, сотрудники других университетов пользовались их исходными текстами и присылали им исправления, всё программное обеспечение в этих лабораториях было полностью академическим.

2.6 Введение ограничений для ПО

В условиях огромного многообразия архитектур компьютеров ПО составляло неотъемлемую часть самой машины, причём далеко не самую дорогостоящую часть. Производители компьютеров поставляли их вместе с операционной системой (ОС). Производство компьютеров было наукоёмким, но в основе своей коммерческим предприятием.

В ситуации, когда ПО является объектом продажи наравне с предметами обихода, на него автоматически распространяются уже не только законы научной разработки, но и свойства материальных предметов, которыми можно торговать, обмениваться, право владения и пользования которыми стоит охранять законодательно. Так ПО попало в разряд интеллектуальной собственности: то есть исходный текст программы стал рассматриваться как произведение, объект применения авторского права.

Чтобы защитить свои интересы, производители компьютеров и ПО используют лицензии — вид договора между обладателем авторских прав и пользователем (покупателем). Подобные договоры заключались и с университетами: например, университету передавались исходные тексты программ и право их изменять, но запрещалось распространять их за пределами университета. Подобные ограничения означали, что тексты соответствующих программ не могли открыто обсуждаться в сообществе, то есть не существовали для научной разработки. Были у компьютеров и ПО покупатели и вне академической среды — например, банки. Таким пользователям не столь важно получить исходные тексты программ, они заинтересованы в ПО как в законченном продукте и готовы платить деньги за надёжные и удобные программы.

Однако компьютеры развивались очень быстро, и бывшие вполне современными в 1970-е к началу 1980-х уже устарели и значительно отставали по производительности от более современных машин. Однако ни для одной из новых архитектур уже не было ОС и прочего ПО, разработанного исключительно в академической среде и по её правилам. Теперь университеты должны были покупать новые компьютеры с новым ПО и выполнять условия лицензии, ограничивающей их права на разработку и распространение ПО — иначе говоря, ограничивающей возможность научной модели разработки и распространения ПО.

В это время в лаборатории искусственного интеллекта (ИИ) MIT разрабатывались так называемые LISP-машины, умевшие на аппаратном уровне интерпретировать язык программирования, похожий на LISP —

Page 22: Современные проблемы информатики и вычислительной техники

22 `

развитый и перспективный язык программирования. На LISP же была написана ОС для таких машин и всё программнПО для них. В начале 1980-х некоторые сотрудники лаборатории ИИ выкупили у MIT права на LISP-машины и математическую систему Macsyma и основали собственные коммерческие компании для дальнейшей разработки в этой области. Очень многие сотрудники лаборатории перешли работать в эти компании, после чего все их дальнейшие разработки уже становились закрытыми для научного сообщества. Новые LISP-машины распространялись с лицензиями, запрещающими пользователям модифицировать и распространять исходные тексты программ. Программы, которые раньше для сотрудников MIT были аналогом научных публикаций, стали принадлежащим кому-то патентованным продуктом.

Одному из сотрудников, оставшихся в лаборатории ИИ MIT, Ричарду Столлману, такое положение дел казалось недопустимым нарушением открытого научного процесса разработки ПО. Он в одиночку пытался в рамках прежней академической модели развивать LISP-машины и открыто реализовывать изменения, аналогичные сделанным в рамках закрытой коммерческой разработки, чтобы LISP-машины MIT могли конкурировать с патентованными аналогами. Конечно, эта попытка угнаться за активной разработкой целой компании была обречена на неудачу.

Тогда в поисках единомышленников Столлман создаёт некоммерческую организацию «Фонд свободного программного обеспечения». Своей основной целью Фонд ставит сохранение ПО, процесс разработки которого всегда будет гарантированно открытым, а исходные тексты всегда доступны. Более масштабная цель Фонда — разработка ОС, целиком состоящей из открыто разрабатываемого ПО.

ОС, разрабатываемая в рамках Фонда, должна была стать совместимой с операционной системой UNIX. К началу 1980-х UNIX очень широко использовалась, в том числе и в академической среде. Для этой ОС существовало много программ, свободно распространявшихся в научном сообществе, поэтому хотелось, чтобы эти программы работали и в новой — свободной — ОС Эта будущая операционная система получила название GNU.

Фонд свободного ПО ранее делил несвободное ПО на полусвободное (отличается от свободного лишь запретом на коммерческое использование) и проприетарное (собственническое), которое не имеет всех 4 свобод, даже если коммерческое использование разрешено.

В отличие от собственнического, полусвободное ПО упоминается редко. Иногда к несвободному ПО относят и всё коммерческое ПО, считая свободное ПО видом бесплатного, однако это неверно: получать выгоду от программы можно не только продажей несвободных лицензий.

Для того чтобы сохранить модель научного сотрудничества между разработчиками, необходимо было обеспечить, чтобы исходные тексты программ, написанных разработчиками, оставались доступными для чтения и критики всему научному сообществу с сохранением авторства произведений. Для этого Столлман сформулировал понятие свободное программное обеспечение (СПО), в котором отразились принципы открытой разработки программ в научном сообществе, сложившемся в американских

Page 23: Современные проблемы информатики и вычислительной техники

23 `

университетах в 1970-е годы. Столлман явно сформулировал 4 критерия СПО. Эти критерии оговаривают те права, которые авторы свободных программ передают любому пользователю:

Программу можно свободно использовать с любой целью.

Можно изучать, как программа работает, и адаптировать её для своих целей. Условием этого является доступность исходного текста программы.

Можно свободно распространять копии программы в помощь товарищу.

Программу можно свободно улучшать и публиковать свою улучшенную версию, чтобы принести пользу всему сообществу. Условием этой свободы является доступность исходного текста программы и возможность внесения в него модификаций и исправлений.

Возможность исправления ошибок и улучшения программ — самая важная особенность свободного и открытого ПО, что просто невозможно для пользователей закрытых частных программ даже при обнаружении в них ошибок и дефектов, количество которых, как правило, неизвестно никому.

Только удовлетворяющая всем 4 перечисленным принципам программа может считаться свободной программой, то есть гарантированно открытой и доступной для модернизации и исправления ошибок и дефектов, и не имеющей ограничений на использование и распространение. Нужно подчеркнуть, что эти принципы оговаривают только доступность исходных текстов программ для всеобщего использования, критики и улучшения, и права пользователя, получившего исполнимый или исходный код программы, но никак не оговаривают связанные с распространением программ денежные отношения, в том числе не предполагают бесплатности.

В англоязычных текстах здесь часто возникает путаница, поскольку слово «free» по-английски означает не только «свободное», но и «бесплатное», и нередко употребляется по отношению к бесплатному ПО, которое распространяется без взимания платы за использование, но недоступно для изменения пользователями и сообществом, потому что его исходные тексты не опубликованы. Такое бесплатное ПО вовсе не является свободным. Наоборот, свободное ПО вполне можно распространять (и распространяют), взимая при этом плату, однако соблюдая при этом критерии свободы: каждому пользователю предоставляется право получить исходные тексты программ без дополнительной платы (за исключением цены носителя), изменять их и распространять далее. Всякое ПО, пользователям которого не предоставляется такого права, является несвободным — независимо от любых других условий.

2.7 Open source software

Открытый доступ к исходным текстам программ является ключевым признаком свободного ПО, поэтому предложенный несколько позднее Реймондом термин «open source software» (ПО с открытым исходным текстом) некоторым представляется даже более удачным для обозначения данного феномена, чем изначально предложенный Столлманом «free software». Столлман настаивает на различии этих двух понятий, так как слова open source указывают лишь на наличие одного, не самого важного (хотя и необходимого для реализации двух из 4 свобод), по его мнению, из свойств, присущих свободному ПО — возможности увидеть исходный код.

Основная общественная лицензия GNU

Декларировав критерии свободного ПО, члены Фонда свободного ПО стали распространять свои программы в соответствии с этими принципами, никак не оформляя это документально: иначе говоря, первоначально свободные программы распространялись вообще без лицензии. Однако произошедший с самим Столлманом прецедент (см. ниже) убедил его в том, что документальное оформление необходимо для свободного ПО.

Ричард Столлман занимался разработкой текстового редактора Emacs на основе исходных текстов Джеймса Гослинга. Тогда Гослинг свободно раздавал свои исходные тексты всем заинтересованным. Однако в какой-то момент Гослинг продал права на распространение Emacs компании UniPress, и эта компания попросила Столлмана прекратить распространение его версии Emacs, так как права принадлежат им. Этот инцидент заставил Столлмана переписать заново те части исходного текста

Page 24: Современные проблемы информатики и вычислительной техники

24 `

Emacs, которые теперь принадлежали UniPress, после чего он разработал собственную лицензию на своё программное обеспечение.

Лицензия, сформулированная Столлманом, должна была работать так же, как и лицензии на несвободное ПО: это типовой договор автора программы (обладателя авторских прав) с пользователем, в котором автор, среди прочего, оговаривает права пользователя по отношению к программе. В отличие от типовой собственнической лицензии, лицензия Столлмана предоставляет пользователю права, являющиеся критериями свободной программы: получать исходные тексты программ, изменять их, распространять изменённые и неизменённые версии. Впоследствии лицензия Столлмана получила название GNU General Public License («Основная общественная лицензия GNU»), сокращённо GNU GPL или просто GPL.

В этой лицензии оговаривается также принципиальное для Столлмана защитное условие распространения свободного ПО: ни один пользователь, сделавший модифицированную версию свободной программы, не имеет права распространять её, не соблюдая всех принципов свободного ПО, то есть делать модификацию свободной программы на несвободную.

Чтобы подчеркнуть отличие такой лицензии, был придуман термин copyleft (копилефт) — игра слов, построенная на значениях английских слов right и left. Действие копилефта основано на том, что производные работы в большинстве случаев наследуют лицензии своих составляющих; если в программе используется небольшая часть стороннего кода под GPL, то вся программа и её производные должны распространяться под GPL, пока они являются производными этого кода. Сообщество разработчиков и пользователей

Главное условие существования свободного ПО - всё-таки не лицензия, а люди, которые готовы бесплатно делиться текстами своих программ и совершенствовать тексты чужих. Свободное ПО унаследовало модель открытой научной разработки, а вместе с ней — и академическую модель взаимодействия между учёными, вылившуюся в специфическую организацию сообщества разработчиков и пользователей.

Взаимопомощь

У любого пользователя ПО непременно возникают вопросы, когда он пытается применить его для решения своих задач. Пользователь несвободной (патентованной) программы платит за неё производителю, который иногда взамен предоставляет ему некоторые гарантии, одна из которых — отвечать на вопросы о работе программы. Специально для этого производитель организует службу поддержки, которая по телефону, электронной почте и другим средствам связи отвечает на вопросы пользователей.

Пользователь свободно распространяемой программы не получает вместе с ней никаких гарантий: автор сделал её исходный текст открытым для общества, но при этом не взял на себя обязательств объяснять всем, как работает программа.

Хотя справедливости ради стоит заметить, что любая несвободная программа в 99 % случаях тоже поставляется «как есть» и без гарантий.

Поскольку сообщество пользователей большинства программ распределено по всему миру, для организации взаимодействия в нём наиболее активные пользователи организуют средства общения в Интернете.

В любой достаточно сложной программе непременно имеются ошибки и дефекты, количество которых обычно неизвестно. Многие крупные производители ПО создают и оплачивают работу отдела контроля качества, который контролирует соответствие процесса разработки ПО определенным требованиям, выполнение которых позволяет снизить вероятность появления ошибок в ПО Тем не менее, в настоящее время отсутствуют методы, позволяющие полностью гарантировать отсутствие ошибок в достаточно сложном ПО (существуют формализованные критерии сложности ПО).

Пользователь закрытой частной программы, столкнувшись с ошибкой, не всегда может выявить её причину и исправить ошибки (поскольку ему недоступны ни исходные тексты программы, ни даже

Page 25: Современные проблемы информатики и вычислительной техники

25 `

отладочная информация), но, скорее всего, способен описать ошибку и условия, в которых она происходит.

Пользователь может сообщить об ошибке производителю программы (обычно посредством обращения всё в ту же службу поддержки), и если там решат, что ошибка действительно в программе, а не в работе пользователя, о ней будет сообщено разработчикам.

В итоге пользователь может долго ожидать исправления ошибки в последующих версиях программы. Нередко обновление собственнической программы приравнивается производителем к приобретению новой копии, что влечет за собой соответствующие издержки и нарушение закона о защите прав потребителей.

Диагностика ошибки, произошедшей на компьютере пользователя, — задача не из лёгких, поскольку у сотрудников службы поддержки (и тем более программистов фирмы) нет доступа к этому компьютеру. Поэтому отделами поддержки широко практикуются программы, выдающие разнообразную информацию о компьютере пользователя, а в сложных случаях и пресловутая отладочная информация (сотрудник просит пользователя прогнать программу в «диагностическом режиме» (как правило, при помощи недокументированной настройки, либо пользователю присылается отладочная версия нужного модуля) и отправить ему полученный файл отчёта).

У типичной свободной программы (то есть, некоммерческой и/или разрабатываемой небольшой компанией или частным лицом) обычно нет оплачиваемого отдела контроля качества. Значит, пользователь может столкнуться с ещё большим количеством ошибок, чем в типичной коммерческой программе. Тем актуальнее для него возможность сообщить об ошибке разработчикам программы. Раньше в сопровождающей программу документации было принято указывать электронный адрес, по которому разработчики принимали сообщения об ошибках.

Принципиальное преимущество пользователя свободной программы заключается в том, что у него, в отличие от пользователей несвободных программ, всегда есть возможность заглянуть в исходные тексты. Конечно, для многих пользователей исходные тексты не более понятны, чем машинный код. Однако при достаточном уровне познаний в программировании пользователь может сам установить причину ошибки в программе, а то и устранить её, исправив соответствующим образом исходный текст. А если пользователь заинтересован в развитии программы, то с его стороны будет разумно не только сообщить автору об ошибке, но и прислать ему свои исправления к исходному тексту программы: автору останется только применить эти исправления к тексту программы, если он найдёт их корректными и уместными. Пересылать автору исправленный текст программы целиком непрактично: он может быть очень большим (десятки тысяч строк), и автору будет нелегко разобраться, что же изменено (а вдруг изменения сделаны неграмотно?).

Чем больше у свободной программы активных пользователей, готовых вносить исправления и дополнения и делиться ими, тем надёжнее работает и быстрее развивается программа. Причём такая свободная модель отслеживания и исправления ошибок для программы, у которой тысячи активных пользователей, может оказаться гораздо более эффективной, чем у любой проприетарной программы: ни одна компания не может себе позволить такой огромный штат сотрудников в отделе контроля качества. Поэтому действительно популярная свободная программа может оказаться гораздо надёжнее проприетарных аналогов.

Нужно заметить, что преимущества свободной разработки для пользователя не следует преувеличивать. Не все свободные программы в равной степени доступны для изменения пользователям, и это совершенно не связано с лицензией на их распространение. Важный фактор здесь — объём программы: если в ней десятки тысяч строк (как, например, в OpenOffice.org), то даже квалифицированному пользователю потребуется слишком много времени, чтобы разобраться, что к чему. Рассчитывать же на то, что разработчики ответят на все замечания и предложения пользователя немедленным исправлением программы, тоже нельзя, поскольку они не несут перед пользователем никаких обязательств по качеству программы. В этом отношении пользователь проприетарной коммерческой программы может оказаться в лучшем положении (хотя обязательства её разработчика обычно также обусловлены лишь законами, а не его волей).

Page 26: Современные проблемы информатики и вычислительной техники

26 `

Очень многие свойства сообщества разработчиков и пользователей свободных программ проистекают из того, что все его участники обычно занимаются этой программой из интереса или потому, что эта программа — необходимый для них инструмент (например, зарабатывания денег или по другой причине). Время, потраченное ими на программу, не оплачивается, поэтому нет никакой надежды, что обстоятельства не переменятся и разработка не прекратится вовсе. Нередки случаи, когда разработка программы начинается благодаря одному автору-энтузиасту, который привлекает многих к участию в разработке, а потом энтузиазм лидера гаснет, а вместе с ним затухает и разработка. К сожалению, сегодня существуют тысячи программ, так никогда и не достигших версии 1.0, хотя «выгорание» лидеров и не единственная этому причина. Кроме того, программа может быть необходимой, но «неинтересной», а потому не найдётся и свободных разработчиков.[11]

Место свободных программ на сегодняшнем рынке ПО очень значительно, и многие коммерческие и государственные предприятия используют свободное ПО прямо или опосредованно.

Многие организации, особенно предоставляющие услуги через Интернет, используют свободный web-сервер Apache, от работы которого непосредственно зависит их прибыль, не говоря уже о серверах на платформе Linux. Главный недостаток с точки зрения коммерческого пользователя: разработчики свободных программ не несут никаких обязательств по качеству программы, кроме моральных. Поэтому, сегодня большие корпорации, например, Intel или IBM, находят необходимым поддерживать проекты по разработке свободного ПО, оплачивая сотрудников, которые работают в рамках этих проектов.

Несвободные программы называют «собственническими». Иногда их неправильно называют просто «коммерческими», что неверно: получать выгоду от программы можно различными способами и многие успешные свободные проекты это подтверждают.

Процесс перехода на конкретное свободное ПО, а также общий тренд постепенного повышения уровня распространённости СПО в целом среди пользователей часто называют миграцией на свободное ПО.

2.8 Распространённость свободного и открытого ПО

Не специализирующиеся на компьютерной тематике СМИ, как правило, отождествляют открытое и свободное ПО, используют их как синонимы. Поэтому данные по распространённости открытого и свободного ПО обычно приводятся вместе.

СПО активно используется в Интернете. Например, самый распространённый веб-сервер Apache является свободным, Википедия работает на MediaWiki, также являющимся свободным проектом.

СПО используется в Министерстве юстиции Бельгии, в котором уже половина компьютеров работает под управлением Linux, и полицией Франции, которая к 2014 году планирует полностью перейти на Ubuntu Linux. О переходе на программное обеспечение с открытым исходным кодом объявило также Патентное ведомство Нидерландов.

Программа перехода на СПО была успешно реализована в Мюнхене. Аналогичная программа имела место в Берлине, но впоследствии было принято решение использовать гибридную инфраструктуру из коммерческого и свободного программного обеспечения.

По состоянию на 2009 год, открытым системам уже принадлежит большая часть (более 60 %) рынка мобильных приложений. По прогнозу Juniper Research, к 2014 году количество смартфонов с открытыми ОС возрастёт в 2 раза (с 106 до 223 миллионов).

Свободное программное обеспечение в России

Свободное программное обеспечение, в любом случае, может свободно устанавливаться и использоваться на любых компьютерах. Использование такого ПО свободно везде: в школах, офисах, вузах, на личных компьютерах и во всех организациях и учреждениях, в том числе, и на коммерческих и государственных, в России и в странах СНГ.

Правительство РФ распоряжением от 17 декабря 2010 года утвердило план перехода федеральных органов исполнительной власти и федеральных бюджетных учреждений на использование свободного программного обеспечения на 2011—2015 годы.

Page 27: Современные проблемы информатики и вычислительной техники

27 `

В учрежденияз Министерства Обороны России, а также в российских посольствах в других странах используется ОС МСВС. Данная ОС, сделанная на основе Red Hat Linux с незначительными изменениями, не является свободным ПО, её исходные коды закрыты, а единственным владельцем прав в нарушение GNU GPL объявлен ВНИИНС (упоминания о предыдущих разработчиках также убраны, хотя такое упоминание является обязательным требованием в лицензии).

С 1 июня 2011 года действует ГОСТ Р ИСО/МЭК 26300-2010 на формат OpenDocument.

С 1 января 2012 года действует ГОСТ Р 54593-2011 «Информационные технологии. Свободное программное обеспечение. Общие положения».

В трёх регионах России в 2008 году развёрнуты эксперименты по внедрению и использованию в средних школах базовых пакетов программ для кабинетов информатики и вычислительной техники, и начата подготовка учителей и преподавателей информатики к работе со свободным программным обеспечением в среде Windows и Linux.

Сдерживающие факторы распространения

Пользователи, которые бы иначе предпочли свободное ПО несвободному, продолжают использовать несвободное по следующим причинам:

В странах, где неавторизованное распространение объектов авторского права является обычным делом, нет ни юридического, ни экономического стимула переходить на свободное ПО. К тому же пользователи, привыкшие к проприетарному ПО, не хотят тратить время на изучение свободного аналога, если это не даёт им прямой выгоды в короткий срок.

В некоторых отраслях мало или вообще нет свободного ПО высокого качества. А именно: ПО, в котором доля работы программиста мала по сравнению с работой художника, редактора

и т. д. Развивающиеся отрасли, для которых мало пригодных к использованию общепринятых

алгоритмов, — машинный перевод, распознавание речи с большим словарём и, в меньшей степени, синтез речи. Кроме того, требуется ручная обработка большого количества текстовых или аудиоданных.

Отрасли, связанные со сложной высокооплачиваемой работой (фотообработка, инженерное проектирование), так как создать программу, близкую по сложности и качеству к проприетарным стандартам де‐факто очень трудно, то свободных аналогов меньше, чем в других отраслях, и пользователю не всегда удаётся найти подходящий для него продукт.

Отрасли, в которых существуют платные или собственнические стандарты де-факто.. Для аппаратного обеспечения в отраслях, где господствует лишь несколько производителей, в

свободном доступе часто отсутствуют не только драйверы, но и спецификации.

Разнообразие лицензий тоже может иметь отрицательное влияние.

Проприетарное ПО настолько популярно, что пользователи не знают о существовании других подобных программ.

Проприетарное ПО зачастую использует собственные форматы файлов и протоколы обмена, описание которых отсутствует в свободном доступе.

2.9 Популярное СПО

Операционные системы.

В 1991 году, во время обучения в Хельсинкском университете Линус Торвальдс заинтересовался ОС и был разочарован лицензией MINIX, которая ограничивала её использование только образовательными целями (что исключало любое коммерческое использование), вследствие чего начал работать над своей собственной ОС, которая в итоге стала Linux.

Торвальдс начал разработку ядра Linux на MINIX, и приложения, написанные для MINIX, были также использованы в Linux. Позже, когда Linux достиг определённой зрелости, появилась возможность продолжать разработку уже на базе самого Linux.

Page 28: Современные проблемы информатики и вычислительной техники

28 `

Приложения GNU также заменили приложения MINIX, так как код GNU, находящийся в свободном доступе, был более удобен для применения в молодой ОС. Исходный код под лицензией GNU GPL может быть использован в других проектах, если они также выпускаются под той же или совместимой лицензией. Для того чтобы сделать Linux доступным для коммерческого использования, Торвальдс начал переходить от своей первоначальной лицензии (которая запрещала коммерческое распространение) на GNU GPL.

Существует несколько десятков бесплатных ОС. Самая известная после Linux операционная система - BSD. Она была разработана в 1978 году в Университете Беркли на базе ОС UNIX. Из наиболее распространенных дистрибутивов этой открытой системы можно назвать FreeBSD, PC-BSD и DesktopBSD.

Серверы на основе FreeBSD отличаются высокой стабильностью работы и также активно применяются. Десктопные версии BSD используют графическую оболочку KDE и внешне практически неотличимы от Linux..

Ubuntu (человечность) — ОС типа Linux, основанная на Debian. Основным разработчиком и спонсором является компания Canonical. В настоящее время проект активно развивается и поддерживается свободным сообществом..

Ubuntu использует примерно 20 млн. пользователей, что делает его самым популярным дистрибутивом Linux (на момент 26 апреля 2011 года) для десктопов. Он является 4-ым в списке самых популярных ОС для веб-серверов и его популярность быстро растёт.

Обычно новые версии дистрибутива выходят каждые полгода и поддерживаются обновлениями безопасности в течение полутора лет. Ubuntu поставляется с подборкой ПО.

Офисные приложения.

Самым популярным является OpenOffice.org, бесплатный аналог пакета MS Office. Сейчас постепенно набирает обороты LibreOffice, не зависящее от компании Oracle (в отличие от OpenOffice.org).

На 2 месте — приложения из так называемого Gnome Office (условного набора свободных офисных программ), текстовый редактор AbiWord и табличный процессор Gnumeric. По функционалу им, конечно, далеко до OpenOffice.org, но зато они могут работать на очень старых и слабых компьютерах.

Офиса не бывает без документов в формате PDF. Конечно, благодаря очень широкой рекламе, самым распространённым просмотрщиком PDF является Adobe Reader.

Архиватор.

Все, кто работает с компьютерами, непременно сталкиваются с таким понятием как архив. В современные ОС встраивается возможность открытия архивов в формате ZIP как обычных папок. Но что делать, если формат иной? Или нужно быстро и эффективно запаковать целый ворох файлов?

Поскольку у вас тоже наверняка возникнет необходимость, например, просмотреть содержимое образа диска в формате ISO, то под рукой всегда должен быть установочный файл свободного архиватора 7-Zip. И портативная версия не помешает, если понесёте свои архивы на чужой компьютер, не имея уверенности в наличии на оном распаковывающего софта.

Графика.

Графикой занимаются очень многие. Поэтому вполне естественно, что свободные и бесплатные программы GIMP (аналог Photoshop), Inkscape (аналог Corel Draw) и Blender (3D-графика) очень популярны и востребованы.

Векторные изображения, созданные с помощью Inkscape, нередко встречаются в Википедии, а Blender используется даже на телевидении для создания рекламных роликов.

Без удобного просмотрщика изображений никому не обойтись. Таковым на данный момент является XnView, очень популярный софт категории Freeware, достаточно функциональный и надёжный.

Браузеры

Page 29: Современные проблемы информатики и вычислительной техники

29 `

Практически все браузеры стали бесплатными. Их разработчики получают доход от размещения поисковых плагинов и рекламных закладок на интернет-магазины. Установили — а закладки уже тут как тут, их надо выпиливать вручную. Благо сделать сие несложно, вызвав контекстное меню правой клавишей мыши.

На 1 месте — Internet Explorer. На 2— Mozilla Firefox.

Все большее распространение получает Google Chrome.

Системы компьютерной математики.

Octave. Максимально приближена к MATLAB. Читает и обрабатывает файлы MatLab. Исходно работает в командной строке, но есть приличные графические оболочки: Octave Workshop для Windows и QtOctave для Linux.

SciLab. Достойная альтернатива Octave. Уже встроена графическая оболочка. Читает файлы MATLAB, но порой требует дополнительного редактирования команд из-за отличия синтаксиса.

Антивирусы.

Почётное 1 место по популярности занимают бесплатные антивирусные программы, что не так уж удивительно.

Наиболее распространён Internet Security от Microsoft.

Чешский антивирус Avast, поскольку является по-настоящему качественным.

За ним раньше шёл немецкий Avira Antivir, однако сейчас его популярность постепенно снижается по мере того, как всё больше пользователей с изумлением обнаруживают факт прекращения автоматических обновлений антивирусных баз.

Почтовая программа

Единственной качественной почтовой программой нынче является Mozilla Thunderbird..

Как известно, объять необъятное принципиально невозможно. Бесплатного софта очень много. Если вам не требуется что-либо специфическое и узкопрофессиональное, то вполне хватит свободного ПО и Freeware для работы в интернете, просмотра фильмов, обработки и прослушивания аудио, коррекции фотографий, просмотра фильмов, написания романов, создания 3D-анимации, сочинения музыки и многих других интересных и полезных дел.

Page 30: Современные проблемы информатики и вычислительной техники

30 `

3 Сенсорные экраны

3.1 Введение

Сенсорный экран изобрели в США в рамках исследований по программированному обучению. Компьютерная система PLATO IV, появившаяся в 1972г., имела сенсорный экран на сетке ИК-лучей, состоявший из 16×16 блоков. Но даже столь низкая точность позволяла пользователю выбирать ответ, нажимая в нужное место экрана.

В 1983г.вышел компьютер HP-150 с сенсорным экраном. Впрочем, в те времена сенсорные экраны применялись преимущественно в промышленной и медицинской аппаратуре.

В потребительские устройства (телефоны, КПК) сенсорные экраны вошли как замена крохотной клавиатуре, когда появились устройства с большими ЖК-экранами.

Сенсорные экраны используются в платёжных терминалах, информационных киосках, оборудовании для автоматизации торговли, карманных компьютерах, мобильных телефонах, игровых консолях, операторских панелях в промышленности.

Достоинства и недостатки в карманных устройствах.

Достоинства

Простота интерфейса.

В аппарате могут сочетаться небольшие размеры и крупный экран.

Быстрый набор в спокойной обстановке.

Серьёзно расширяются мультимедийные возможности аппарата.

Недостатки

Нет тактильной отдачи.

Высокое энергопотребление.

Особо тонкие модели экранов даже при незначительном повреждении рискуют быть растресканными или вообще разбитыми.

Достоинства и недостатки в стационарных устройствах.

В информационных и торговых автоматах, операторских панелях и прочих устройствах, в которых нет активного ввода, сенсорные экраны зарекомендовали себя как очень удобный способ взаимодействия человека с машиной.

Достоинства:

Повышенная надёжность.

Устойчивость к жёстким внешним воздействиям (включая вандализм), пыле- и влагозащищённость.

Недостатки

Нет тактильной отдачи.

Работая с вертикальным экраном, пользователь вынужден держать руку на весу. Поэтому вертикальные экраны пригодны только для эпизодического использования наподобие банкоматов.

На горизонтальном экране руки загораживают обзор.

Даже с острым пером параллакс ограничивает точность позиционирования действий оператора на сенсорных экранах без курсора. В то же время использование курсора создаёт оператору дополнительные сложности, уменьшая эргономичность.

При использовании экрана не полностью чистыми руками использование затрудняется ввиду трудностей движения пальцев, а также образующихся отпечатков пальцев и пятен, если на экране нет специальных покрытий для их нейтрализации.

Эти недостатки не позволяют использовать только сенсорный экран в устройствах, с которыми человек работает часами. Впрочем, в грамотно спроектированном устройстве сенсорный экран может быть не

Page 31: Современные проблемы информатики и вычислительной техники

31 `

единственным устройством ввода — например, на рабочем месте кассира сенсорный экран может применяться для быстрого выбора товара, а клавиатура — для ввода цифр.

3.2 Принципы работы сенсорных экранов

Существует множество разных типов сенсорных экранов, которые работают на разных физических принципах.

3.3 Резистивные сенсорные экраны

Четырёхпроводной экран.

Резистивный сенсорный экран состоит из стеклянной панели и гибкой пластиковой мембраны. И на панель, и на мембрану нанесено резистивное покрытие. Пространство между стеклом и мембраной заполнено микро изоляторами, которые равномерно распределены по активной области экрана и надёжно изолируют проводящие поверхности. Когда на экран нажимают, панель и мембрана замыкаются, и контроллер с помощью аналогово-цифрового преобразователя регистрирует изменение сопротивления и преобразует его в координаты прикосновения (X и Y). В общих чертах алгоритм считывания таков:

На верхний электрод подаётся напряжение +5В, нижний заземляется. Левый с правым соединяются накоротко, и проверяется напряжение на них. Это напряжение соответствует Y-координате экрана.

Аналогично на левый и правый электрод подаётся +5В и «земля», с верхнего и нижнего считывается X-координата.

Пятипроводной экран.

5-проводной экран более надёжен за счёт того, что резистивное покрытие на мембране заменено проводящим (5-проводной экран продолжает работать даже с прорезанной мембраной). На заднем стекле нанесено резистивное покрытие с четырьмя электродами по углам.

Изначально все 4 электрода заземлены, а мембрана «подтянута» резистором к +5В. Уровень напряжения на мембране постоянно отслеживается аналогово-цифровым преобразователем. Когда ничто не касается сенсорного экрана, напряжение равно 5 В.

Как только на экран нажимают, микропроцессор улавливает изменение напряжения мембраны и начинает вычислять координаты касания следующим образом:

На два правых электрода подаётся напряжение +5В, левые заземляются. Напряжение на экране соответствует X-координате.

Y-координата считывается подключением к +5В обоих верхних электродов и к «земле» обоих нижних.

Page 32: Современные проблемы информатики и вычислительной техники

32 `

Существуют также 8-проводные сенсорные экраны. Они улучшают точность отслеживания, но не повышают надёжности.

Резистивные сенсорные экраны дёшевы и стойки к загрязнению. Резистивные экраны реагируют на прикосновение любым гладким твёрдым предметом: рукой (голой или в перчатке), пером, кредитной картой, медиатором. Их используют везде, где вандализм и низкие температуры не исключены: для автоматизации промышленных процессов, в медицине, в сфере обслуживания (POS-терминалы), в персональной электронике (КПК). Лучшие образцы обеспечивают точность в 4096×4096 пикселей.

Недостатками резистивных экранов являются низкое светопропускание (не более 85% для 5-проводных моделей и ещё более низкое для 4-проводных), низкая долговечность (не более 35 млн нажатий в одну точку) и недостаточная устойчивость к вандализму (плёнку легко разрезать).

3.4 Матричные сенсорные экраны

Конструкция аналогична резистивной, но упрощена до предела. На стекло нанесены горизонтальные проводники, на мембрану — вертикальные.

При прикосновении к экрану проводники соприкасаются. Контроллер определяет, какие проводники замкнулись, и передаёт в микропроцессор соответствующие координаты.

Имеют очень низкую точность. Элементы интерфейса приходится специально располагать с учётом клеток матричного экрана. Единственное достоинство — простота, дешевизна и неприхотливость. Обычно матричные экраны опрашиваются по строкам (аналогично матрице кнопок); Постепенно заменяются резистивными.

3.5 Ёмкостные сенсорные экраны

Ёмкостный (или поверхностно-ёмкостный) экран использует тот факт, что предмет большой ёмкости проводит переменный ток.

Ёмкостный сенсорный экран представляет собой стеклянную панель, покрытую прозрачным резистивным материалом (обычно применяется сплав оксида индия и оксида олова). Электроды, расположенные по углам экрана, подают на проводящий слой небольшое переменное напряжение (одинаковое для всех углов). При касании экрана пальцем или другим проводящим предметом появляется утечка тока. При этом чем, ближе палец к электроду, тем меньше сопротивление экрана, а значит, сила тока больше. Ток во всех четырёх углах регистрируется датчиками и передаётся в контроллер, вычисляющий координаты точки касания.

Page 33: Современные проблемы информатики и вычислительной техники

33 `

В более ранних моделях ёмкостных экранов применялся постоянный ток — это упрощало конструкцию, но при плохом контакте пользователя с землёй приводило к сбоям.

Ёмкостные сенсорные экраны надёжны, порядка 200 млн. нажатий (около 6,5 лет нажатий с промежутком в 1 секунду), не пропускают жидкости и отлично терпят не токопроводящие загрязнения. Прозрачность на уровне 90%. Впрочем, проводящее покрытие, расположенное прямо на внешней поверхности, всё ещё уязвимо. Поэтому ёмкостные экраны широко применяются в автоматах, лишь установленных в защищённом от непогоды помещении. Не реагируют на руку в перчатке.

Стоит заметить, что из-за различий в терминологии часто путают поверхностно- и проекционно-ёмкостные экраны. Экран, например, iPhone является проекционно-ёмкостным, а не ёмкостным.

3.6 Проекционно-ёмкостные сенсорные экраны

На внутренней стороне экрана нанесена сетка электродов. Электрод вместе с телом человека образует конденсатор; электроника измеряет ёмкость этого конденсатора (подаёт импульс тока и измеряет напряжение).

Прозрачность таких экранов до 90%, температурный диапазон чрезвычайно широк. Очень долговечны (узкое место — сложная электроника, обрабатывающая нажатия). На ПЁCЭ может применяться стекло толщиной вплоть до 18 мм, что приводит к крайней вандалоустойчивости. На непроводящие загрязнения не реагируют, проводящие легко подавляются программными методами. Поэтому проекционно-ёмкостные сенсорные экраны широко применяются и в персональной электронике, и в автоматах, в том числе установленных на улице.

3.7 Сенсорные экраны на поверхностно-акустических волнах

Экран представляет собой стеклянную панель с пьезоэлектрическими преобразователями (ПЭП), находящимися по углам. По краям панели находятся отражающие и принимающие датчики. Принцип действия такого экрана заключается в следующем. Специальный контроллер формирует высокочастотный электрический сигнал и посылает его на ПЭП. ПЭП преобразует этот сигнал в ПАВ, а отражающие датчики его соответственно отражают. Эти отражённые волны принимаются

Page 34: Современные проблемы информатики и вычислительной техники

34 `

соответствующими датчиками и посылаются на ПЭП. ПЭП, в свою очередь, принимают отражённые волны и преобразовывают их в электрический сигнал, который затем анализируется с помощью контроллера. При касании экрана пальцем часть энергии акустических волн поглощается. Приёмники фиксируют это изменение, а микроконтроллер вычисляет положение точки касания. Реагирует на касание предметом, способным поглотить волну (палец, рука в перчатке, пористая резина).

Главным достоинством экрана на поверхностных акустических волнах (ПАВ) является возможность отслеживать не только координаты точки, но и силу нажатия благодаря тому, что степень поглощения акустических волн зависит от величины давления в точке касания. Экран не прогибается под нажатием пальца и не деформируется, поэтому сила нажатия не влечет за собой качественных изменений в обработке контроллером данных о координатах воздействия, который фиксирует только область, перекрывающую путь акустических импульсов. Данное устройство имеет очень высокую прозрачность, так как свет от отображающего прибора проходит через стекло, не содержащее резистивных или проводящих покрытий. В некоторых случаях для борьбы с бликами стекло вообще не используется, а излучатели, приёмники и отражатели крепятся непосредственно к экрану отображающего устройства. Несмотря на сложность конструкции, эти экраны довольно долговечны.

По заявлению, например, американской компании Tyco Electronics и тайваньской фирмы GeneralTouch, они выдерживают до 50 млн касаний в одной точке, что превышает ресурс 5-проводного резистивного экрана. Экраны на ПАВ применяются, в основном, в игровых автоматах, в охраняемых справочных системах и образовательных учреждениях. Как правило, экраны ПАВ различают на обычные — толщиной 3 мм, и вандалостойкие — 6 мм. Последние выдерживают удар кулаком среднего мужчины или падение металлического шара весом 0.5 кг с высоты 1.3 метра (по данным Elo Touch Systems). На рынке предлагаются варианты подключения к компьютеру как через интерфейс RS232, так и через интерфейс USB. На данный момент большей популярностью пользуются контроллеры к сенсорным экранам ПАВ, поддерживающие и тот, и другой тип подключения — combo (данные Elo Touch Systems).

Главным недостатком экрана на ПАВ являются сбои в работе при наличии вибрации или при воздействии акустическими шумами, а также при загрязнении экрана. Любой посторонний предмет, размещённый на экране (например, жевательная резинка), полностью блокирует его работу. Кроме того, данная технология требует касания предметом, который обязательно поглощает акустические волны, — то есть, например, пластиковая банковская карточка в данном случае неприменима.

Точность этих экранов выше, чем матричных, но ниже, чем традиционных ёмкостных. Для рисования и ввода текста они, как правило, не используются.

3.8 Инфракрасные сенсорные экраны

Принцип работы инфракрасной сенсорной панели прост — сетка, сформированная горизонтальными и вертикальными инфракрасными лучами, прерывается при касании к монитору любым предметом. Контроллер определяет место, в котором луч был прерван.

Инфракрасные сенсорные экраны боятся загрязнений и поэтому применяются там, где важно качество изображения, например, в электронных книгах. Из-за простоты и ремонтопригодности схема популярна у военных. Часто на таком принципе делают клавиатуры домофонов. Данный тип экрана применяется в мобильных телефонах компании Neonode.

3.9 Оптические сенсорные экраны

Стеклянная панель снабжена инфракрасной подсветкой. На границе «стекло-воздух» получается полное внутреннее отражение, на границе «стекло — посторонний предмет» свет рассеивается. Остаётся заснять картину рассеяния, для этого существуют две технологии:

В проекционных экранах рядом с проектором ставится камера.

Либо светочувствительным делают дополнительный 4 субпиксель ЖК-экрана.

Позволяют отличить нажатия рукой от нажатий какими-либо предметами, Возможны большие сенсорные поверхности, вплоть до классной доски.

Page 35: Современные проблемы информатики и вычислительной техники

35 `

4 Облачные вычисления

Облачные вычисления (cloud computing) - это модель обеспечения повсеместного и удобного сетевого доступа по требованию к общему набору конфигурируемых вычислительных ресурсов (например, сетям передачи данных, серверам, устройствам хранения данных, приложениям и сервисам. — как вместе, так и по отдельности), которые могут быть оперативно предоставлены и освобождены с минимальными эксплуатационными затратами и/или обращениями к провайдеру.

Потребители облачных вычислений могут значительно уменьшить расходы на инфраструктуру информационных технологий (в краткосрочном и среднесрочном планах) и гибко реагировать на изменения вычислительных потребностей, используя свойства вычислительной эластичности облачных услуг.

Рынок публичных облачных вычислений в 2009г. году составил $17 млрд — около 5 % от всего рынка информационных технологий.

Первоначально концепция использования вычислительных ресурсов по принципу системы коммунального хозяйства была предложена в 1960-е годы Джоном Маккарти

Возникновение англоязычного термина начало активно обсуждаться в 2008г. году в одной из тематических интернет-конференций. В результате дискуссии выдвигались различные версии, по одной из которых термин облако (сloud) был впервые использован главой компании Google Эриком Шмидтом в выступлении и получил распространение в средствах массовой информации. Другая популярная версия предполагает, что термин cloud computing стал широко употребляться в США с 2005г. после запуска компанией Amazon.com проекта Elastic Compute Cloud и широко распространился в бизнесе, среди поставщиков информационных технологий и в научно-исследовательской среде. Термин «облако» используется как метафора, основанная на изображении Интернета на диаграмме компьютерной сети, или как образ сложной инфраструктуры, за которой скрываются все технические детали.

Национальным институтом стандартов и технологий США зафиксированы следующие обязательные характеристики облачных вычислений:

Самообслуживание по требованию, потребитель самостоятельно определяет и изменяет вычислительные потребности, такие как серверное время, скорости доступа и обработки данных, объём хранимых данных без взаимодействия с представителем поставщика услуг;

Универсальный доступ по сети, услуги доступны потребителям по сети передачи данных вне зависимости от используемого терминального устройства;

Объединение ресурсов, поставщик услуг объединяет ресурсы для обслуживания большого числа потребителей в единый пул для динамического перераспределения мощностей между потребителями в условиях постоянного изменения спроса на мощности; при этом потребители контролируют только основные параметры услуги (например, объём данных, скорость доступа), но фактическое распределение ресурсов, предоставляемых потребителю, осуществляет поставщик (в некоторых случаях потребители всё-таки могут управлять некоторыми физическими параметрами перераспределения, например, указывать желаемый центр обработки данных из соображений географической близости);

Эластичность, услуги могут быть предоставлены, расширены, сужены в любой момент времени, без дополнительных издержек на взаимодействие с поставщиком, как правило, в автоматическом режиме;

Учёт потребления, поставщик услуг автоматически исчисляет потреблённые ресурсы на определённом уровне абстракции (например, объём хранимых данных, пропускная способность, количество пользователей, количество транзакций), и на основе этих данных оценивает объём предоставленных потребителям услуг.

С точки зрения поставщика, благодаря объединению ресурсов и непостоянному характеру потребления со стороны потребителей, облачные вычисления позволяют экономить на масштабах, используя меньшие аппаратные ресурсы, чем требовались бы при выделенных аппаратных мощностях для каждого потребителя, а за счёт автоматизации процедур модификации выделения ресурсов существенно снижаются затраты на абонентское обслуживание.

Page 36: Современные проблемы информатики и вычислительной техники

36 `

С точки зрения потребителя, эти характеристики позволяют получить услуги с высоким уровнем доступности и низкими рисками неработоспособности, обеспечить быстрое масштабирование вычислительной системы благодаря эластичности без необходимости создания, обслуживания и модернизации собственной аппаратной инфраструктуры.

Удобство и универсальность доступа обеспечивается широкой доступностью услуг и поддержкой различного класса терминальных устройств (персональных компьютеров, мобильных телефонов, интернет-планшетов).

4.1 Модели развёртывания

Частное облако (private cloud) — инфраструктура, предназначенная для использования одной организацией, включающей несколько потребителей (например, подразделений одной организации), возможно также клиентами и подрядчиками данной организации. Частное облако может находиться в собственности, управлении и эксплуатации как самой организации, так и третьей стороны (или какой-либо их комбинации), и оно может физически существовать как внутри, так и вне юрисдикции владельца.

Публичное облако (public cloud) — инфраструктура, предназначенная для свободного использования широкой публикой. Публичное облако может находиться в собственности, управлении и эксплуатации коммерческих, научных и правительственных организаций (или какой-либо их комбинации). Публичное облако физически существует в юрисдикции владельца — поставщика услуг.

Гибридное облако (hybrid cloud) — это комбинация из двух или более различных облачных инфраструктур (частных, публичных или общественных), остающихся уникальными объектами, но связанных между собой стандартизованными или частными технологиями передачи данных и приложений (например, кратковременное использование ресурсов публичных облаков для балансировки нагрузки между облаками).

Общественное облако (community cloud) — вид инфраструктуры, предназначенный для использования конкретным сообществом потребителей из организаций, имеющих общие задачи (например, миссии, требований безопасности, политики, и соответствия различным требованиям). Общественное облако может находиться в кооперативной (совместной) собственности, управлении и эксплуатации одной или более из организаций сообщества или третьей стороны (или какой-либо их комбинации), и оно может физически существовать как внутри, так и вне юрисдикции владельца.

4.2 Модели обслуживания

Программное обеспечение как услуга (SaaS, Software-as-a-Service) — модель, в которой потребителю предоставляется возможность использования прикладного ПО провайдера, работающего в облачной инфраструктуре и доступного из различных клиентских устройств или посредством тонкого клиента, например, из браузера (например, веб-почта) или интерфейс программы. Контроль и управление основной физической и виртуальной инфраструктурой облака, в том числе сети, серверов, операционных систем, хранения, или даже индивидуальных возможностей приложения (за исключением ограниченного набора пользовательских настроек конфигурации приложения) осуществляется облачным провайдером.

Платформа как услуга (PaaS, Platform-as-a-Service) — модель, когда потребителю предоставляется возможность использования облачной инфраструктуры для размещения базового программного обеспечения для последующего размещения на нём новых или существующих приложений (собственных, разработанных на заказ или приобретённых тиражируемых приложений). В состав таких платформ входят инструментальные средства создания, тестирования и выполнения прикладного программного обеспечения — системы управления базами данных, связующее программное обеспечение, среды исполнения языков программирования — предоставляемые облачным провайдером.

Контроль и управление основной физической и виртуальной инфраструктурой облака, в том числе сети, серверов, операционных систем, хранения осуществляется облачным провайдером, за исключением разработанных или установленных приложений, а также, по возможности, параметров конфигурации среды (платформы).

Page 37: Современные проблемы информатики и вычислительной техники

37 `

Инфраструктура как услуга (IaaS, IaaS or Infrastructure-as-a-Service) предоставляется как возможность использования облачной инфраструктуры для самостоятельного управления ресурсами обработки, хранения, сетей и другими фундаментальными вычислительными ресурсами, например, потребитель может устанавливать и запускать произвольное программное обеспечение, которое может включать в себя операционные системы, платформенное и прикладное программное обеспечение. Потребитель может контролировать операционные системы, виртуальные системы хранения данных и установленные приложения, а также ограниченный контроль набора доступных сервисов (например, межсетевой экран, DNS). Контроль и управление основной физической и виртуальной инфраструктурой облака, в том числе сети, серверов, типов используемых операционных систем, систем хранения осуществляется облачным провайдером.

4.3 Экономические аспекты

При использовании облачных вычислений потребители информационных технологий могут существенно снизить капитальные расходы — на построение центров обработки данных, закупку серверного и сетевого оборудования, аппаратных и программных решений по обеспечению непрерывности и работоспособности — так как эти расходы поглощаются провайдером облачных услуг. Кроме того, длительное время построения и ввода в эксплуатацию крупных объектов инфраструктуры информационных технологий и высокая их начальная стоимость ограничивают способность потребителей гибко реагировать на требования рынка, тогда как облачные технологии обеспечивают возможность практически мгновенно реагировать на увеличение спроса на вычислительные мощности.

При использовании облачных вычислений затраты потребителя смещаются в сторону операционных — таким образом классифицируются расходы на оплату услуг облачных провайдеров.

Для объяснения экономической составляющей облачных подходов к вычислениям часто используется аналогия с услугами водо- или электроснабжения, предоставляемыми в развитых инфраструктурах по соответствующим коммунальным сетям, легкодоступными и оплачиваемыми по мере потребления, в сравнении с разработкой каждым потребителем собственного водозабора или монтированием собственной электроустановки.

Page 38: Современные проблемы информатики и вычислительной техники

38 `

5 Проблемы микро- и наноэлектроники

5.1 Нанотехнологии

По сообщению агентства Reuters, две группы западных ученых разработали новые материалы, которые готовы к использованию в производстве электроники, обладающей значительно лучшими рабочими характеристиками, нежели существующие аналоги. Новые разработки позволят создавать более миниатюрные, мощные и производительные образцы электронных устройств

.

Первая группа исследователей разработала крошечные транзисторы для процессоров и чипов памяти, вторая создала материал, который можно использовать для записи цифровых данных. По заверению разработчиков, портативный жесткий диск размером с монету, созданный на базе нового материала, позволяет хранить более 1 Тб данных.

Об обеих разработках ученые сообщили в публикации научного журнала Science. В обоих случаях исследователи создавали свои новинки при помощи нанотехнологий.

«Мы доказали, что можем создавать важные технологии и устройства на их базе, которые в разы меньше существующих аналогов», – говорит Джереми Леви (Jeremy Levy), разработчик из Университета Питтсбурга. Его команда создала крошечные транзисторы, в основе которых находятся 2 керамических кристальных материала – титанат стронция и алюминат лантана. Оба этих элемента являются природными изоляторами, но при их объединении они прекрасно проводят положительные заряды.

По словам Леви, при помощи наконечника атомного силового микроскопа исследователям удалось создать примитивную микросхему, которая обрабатывала электрические заряды, что в электроникe трактуется как логические нули и единицы. «Наши транзисторы, вероятно, самые маленькие из всех, что были созданы ранее. При своих атомных размерах они способны стабильно работать», – говорит Леви. Ученый отмечает, что такие транзисторы могут быть использованы для создания процессоров, устройств памяти или датчиков.

В то же время группа специалистов из Университетов Массачусетса и Калифорнии создали тончайший пленочный материал, способный в разы увеличить плотность хранения информации в цифровом виде. В основе данной разработки находятся кристаллы сапфиров, на которых путём нагрева создаются специальные атомные слои на полимерной поверхности.

Том Рассел (Thomas Russell) из Университета Массачусетсa говорит, что до сих пор многие полимерные материалы часто теряли данные, которые на них записаны, теперь же этот недостаток

Page 39: Современные проблемы информатики и вычислительной техники

39 `

удалось преодолеть. В итоге, плотность записи «атомных данных» на новый материал в 15 раз превышает плотность записи на современные терабайтные жесткие диски.

5.2 Замена кремния на гафний

Более 50 лет после создания первых интегральных схем развитие твердотельной электроники следовало закону Мура: число транзисторов на кристалле удваивалось приблизительно каждые 2 года. Было ясно, что определенным пределом этой закономерности было бы достижение элементами атомного размера. Оказалось, что предел увеличения степени интеграции достигается ранее, это связано как с фундаментальными свойствами используемых веществ, так и с побочными эффектами.

Основным материалом современной электроники является кремний. Отдельные приборы интегральных схем строятся с использованием кремния, разные участки которого могут быть легированы разными примесями, в архитектуре прибора используются диэлектрики и проводники. При уменьшении размеров первые проблемы возникли с проводящими фрагментами приборов.

Можно ожидать, что дальнейшее увеличение плотности размещения элементов и рост производительности интегральных схем не прекратится и после достижения физического предела кремниевой электроники. В настоящее время уже создаются заделы будущих устройств и технологий. Перспективными в этом отношении являются различные объекты: углеродные нанотрубки, супрамолекулярные соединения.

Физики в США создали самый быстрый графеновый транзистор, с граничной частотой 100 ГГц. Устройство может быть в дальнейшем миниатюризировано и оптимизировано так, чтобы иметь преимущество по сравнению с традиционными кремниевыми приборами. Транзистор может применяться в СВЧ связи и системах визуализации.

Графен – слой углерода одноатомной толщины – перспективен для использования в электронных приборах благодаря экстремально высокой скорости перемещения электронов в нем. Это происходит потому, что электроны ведут себя как релятивистские частицы без массы покоя. Это и другие необычные физические и механические свойства означают, что графен способен заменить кремний, в качестве альтернативного электронного материала и может использоваться для изготовления более быстродействующих транзисторов, чем существующие на сегодняшний день.

Графеновый транзистор уже имеет более высокую граничную частоту, чем лучшие MOSFET приборы с такой же длиной затвора (их граничная частота около 40 ГГц). Граничная частота — это частота, выше которой в транзисторе проявляется существенное ухудшение производительности. Новое устройство побило предыдущий рекорд IBM в 26 ГГц (январь 2009г.).

Одним из недостатков графеновых устройств, однако, является то, что они не могут быть использованы в цифровых схемах. Это происходит потому, что графен имеет нулевой энергетический интервал между валентной зоной и зоной проводимости, именно эта запрещенная зона позволяет обычным полупроводникам осуществлять переключение тока.

Такие высокочастотные транзисторы могут быть использованы для усиления аналоговых СВЧ-сигналов в системах связи и отображениия, включая радар с высоким разрешением, медицинские и охранные системы визуализации.

Компания IBM создала прибор с рекордно высоким для транзисторов на базе графена быстродействием и расширенным диапазоном рабочих температур.

Благодаря хорошей подвижности зарядов графен заслужил репутацию перспективного материала для электроники.

На этой базе исследователи построили полевой транзистор с затвором длиной всего 40 нм (смотрите рисунок под заголовком). На испытаниях прибор показал очень высокую частоту среза — 155 Ггц

Page 40: Современные проблемы информатики и вычислительной техники

40 `

Кроме того, авторы прибора проверили его функционирование при криогенных температурах (они негативно влияют на движение зарядов в полупроводниковых приборах). Выяснилось, что новый графеновый транзистор хорошо себя чувствует вплоть до температуры в 4,3 кельвина.

При этом американцы отмечают, что качество использованного графена было не самым высоким, так что достигнутые показатели — не предел для новой технологии.

5.3 Фуллерены и нанотрубки

Фуллерен — молекула, состоящая из атомов углерода, расположенных в вершинах правильных шести- и пятиугольников, образующих каркасную форму в виде замкнутой полой сферической или эллипсоидной оболочки. Молекулы фуллеренов могут содержать 28, 32, 50, 60, 70, 76 и т.д. атомов углерода. Самый известный из фуллеренов — это так называемый фуллерен C60. Этот фуллерен, обладает максимальной стабильностью. Атомы углерода в нем располагаются на сферической поверхности в вершинах 20 правильных шестиугольников и 12 правильных пятиугольников; каждый шестиугольник имеет три общие стороны с другими шестиугольниками и три общие стороны с пятиугольниками, то есть все пятиугольники граничат только с шестиугольниками.

Углеродная нанотрубка — цилиндрическая молекула, состоящая из атомов углерода, имеющая форму цилиндра диаметром около 1 нм и длину от одного до сотен мкм (рис. 2) Внешне выглядит как свернутая в цилиндр графитовая плоскость. Цилиндр оканчивается молекулой фуллерена. Впервые обнаружена Сумио Ииджимой (корпорация NEC) в 1991 г. как побочный продукт синтеза фуллерена С60.

Page 41: Современные проблемы информатики и вычислительной техники

41 `

Нанотрубки бывают однослойными и многослойными. Последние представляют собой несколько однослойных нанотрубок, вложенных одна в другую. Основная классификация нанотрубок проводится по способу сворачивания графитовой плоскости. Различают прямые нанотрубки и спиральные нанотрубки.

Нанотрубки обладают уникальными электрическими, магнитными и оптическими свойствами. Они могут быть как проводниками, так и полупроводниками. Нанотрубки на порядок прочнее стали. Получают нанотрубки путем термического распыления графитовых электродов в плазме дугового разряда. В результате такой обработки получается достаточно легкий и пористый материал, состоящий из многослойных нанотрубок со средним диаметром 20 нм и длиной около 10 мкм. Изготовление нанотрубок обходится дорого — 1 грамм стоит несколько сотен долларов США.

На основе нанотрубок создаются новые сверхпрочные и сверхлегкие композиционные материалы. Нанотрубки используются в качестве иглы для сканирующего туннельного и атомного силового микроскопа, а также для создания полупроводниковых гетероструктур. Разрабатываются технологии применения нанотрубок в биомедицине и криминалистике.

Нанотрубки находят все большее применение в микроэлектронике, они используются для создания диодов и полевых транзисторов.

Например, изогнутая нанотрубка по свойствам проводимости адекватна диоду. Дело в том, что для изгиба нанотрубки в нее нужно внедрить дефектный элемент (например, заменить один из шестиугольников на пятиугольник). В результате степень скрученности нанотрубки с разных относительно изгиба сторон оказывается различной, что приводит к разному типу проводимости. С одной стороны относительно изгиба может быть металлическая проводимость, а с другой — полупроводниковая. В этом случае такая нанотрубка с изломом будет представлять собой структуру типа "металл—полупроводник" с односторонней (как и у диода) проводимостью.

В полевых транзисторах роль канала выполняет нанотрубка. В обычном состоянии концентрация свободных носителей зарядов (дырок и электронов) в нанотрубке мала, то есть она является диэлектриком. Зона проводимости в данном случае отделена от валентной зоны запрещенной зоной шириной в несколько электрон-вольт. Однако при помещении нанотрубки в электрическое поле ширина запрещенной зоны меняется и концентрация свободных носителей зарядов увеличивается. В этих условиях нанокарбоновая трубка становится проводником. Электрическое поле, управляющее проводимостью нанокарбоновой трубки, создается затвором, которым, как уже отмечалось, является кремниевая подложка. При потенциале затвора порядка 6 В концентрация свободных носителей заряда в валентной зоне достигает максимума, и нанотрубка становится хорошим проводником. Таким образом, меняя напряжение на затворе, можно управлять проводимостью нанотрубки и соответственно открывать или запирать транзистор.

Page 42: Современные проблемы информатики и вычислительной техники

42 `

Созданы и опробованы прототипы тонких плоских дисплеев, работающих на матрице из нанотрубок.

Другое применение нанотрубок — это создание энергонезависимой оперативной памяти NRAM (Nonvolatile Random Access Memory).

В NRAM на кремниевую подложку наносится тонкая изолирующая пленка оксида кремния, вдоль которой размещены токопроводящие электроды шириной в 130 нм, отделенные друг от друга изолирующими слоями. Над электродами перпендикулярно к ним расположены массивы нанотрубок, которые замыкаются с обеих сторон на проводящие контакты. В обычном состоянии (состояние OFF) нанотрубки не касаются электродов и находятся над ними на высоте порядка 13 нм. Если к нижнему электроду приложить напряжение, то нанотрубка под воздействием электрического поля начнет выгибаться и коснется нижнего электрода. Однако такое состояние (состояние ON) оказывается устойчивым за счет баланса между возникающим механическим напряжением и Ван-дер-Ваальсовыми силами. В результате даже после исчезновения напряжения форма нанотрубки не изменится. Таким образом, меняя напряжение на электроде, можно переходить между двумя стабильными механическими состояниями нанотрубок, в одном из которых имеется контакт с электродом, а в другом — нет. Одно из этих состояний будет отвечать логическому нулю, а другое — логической единице.

Для того чтобы прочитать содержимое элементарной ячейки памяти, между нижним электродом и контактом, к которому подсоединены нанотрубки, отвечающие выбранной ячейке памяти, подается напряжение. Если ячейка памяти находится в состоянии OFF, при котором нет физического контакта между электродом и нанотрубкой, то электрическая цепь оказывается разомкнутой и напряжение будет высоким, что соответствует логической единице. Если же ячейка памяти находится в состоянии ON, то есть имеется контакт между нанотрубкой и нижним электродом, то цепь замыкается и напряжение будет низким, что соответствует логическому нулю.

В сравнении с традиционными типами памяти, память NRAM имеет ряд преимуществ. Во-первых, несмотря на то, что это RAM-память, она является энергонезависимой. Во-вторых, по утверждениям компании Nantero, плотность записи информации в устройствах NRAM может достигать 5 млрд. бит на квадратный сантиметр (в несколько раз больше, чем в сегодняшних микросхемах памяти), а частота работы памяти — до 2 ГГц.

5.4 Технологические нормы

Технологический процесс полупроводникового производства состоит из последовательности технологических (обработка, сборка) и контрольных операций, часть производственного процесса производства п/п изделий (транзисторов, диодов и тп.).

При производстве п/п интегральных микросхем применяется фотолитография и литографическое оборудование. Разрешающая способность (в мкм или нм) этого оборудования (проектные нормы) и определяет название применяемого конкретного технологического процесса.

Совершенствование технологии и пропорциональное уменьшение размеров п/п структур способствуют улучшению характеристик (размеры, энергопотребление, стоимость) полупроводниковых приборов (микросхем, процессоров, микроконтроллеров и тд.). Особую значимость это имеет для процессорных ядер, в аспектах потребления электроэнергии и повышения производительности, поэтому ниже указаны процессоры (ядра) массового производства на данном техпроцессе.

5.4.1 Этапы технологического процесса Пластина монокристаллического кремния с готовыми микросхемами:

Page 43: Современные проблемы информатики и вычислительной техники

43 `

Технологический процесс производства полупроводниковых приборов и интегральных микросхем (микропроцессоров, модулей памяти и др.) включает нижеследующие операции.

Механическую обработку полупроводниковых пластин — получают пластины полупроводника со строго заданной геометрией, нужной кристаллографической ориентацией (не хуже ±5 %) и классом чистоты поверхности. Эти пластины в дальнейшем служат заготовками в производстве приборов или подложками для нанесения эпитаксиального слоя.

Химическую обработку (предшествующую всем термическим операциям) — удаление механически нарушенного слоя полупроводника и очистка поверхности пластины. Основные методы химической обработки: жидкостное и газовое травление, плазмохимические методы. Для получения на пластине рельефа (профилирование поверхности) в виде чередующихся выступов и впадин определённой геометрии, для вытравливания окон в маскирующих покрытиях, для проявления скрытого изображения в слое экспонированного фоторезиста, для удаления его заполимеризированных остатков, для получения контактных площадок и разводки в слое металлизации применяют химическую (электрохимическую) обработку.

Эпитаксиальное наращивание слоя полупроводника — осаждение атомов полупроводника на подложку, в результате чего на ней образуется слой, кристаллическая структура которого подобна структуре подложки. При этом подложка часто выполняет лишь функции механического носителя.

Получение маскирующего покрытия — для защиты слоя полупроводника от проникновения примесей на последующих операциях легирования. Чаще всего проводится путём окисления эпитаксиального слоя кремния в среде кислорода при высокой температуре.

Фотолитография — производится для образования рельефа в диэлектрической плёнке.

Введение электрически активных примесей в пластину для образования отдельных p- и n-областей — нужно для создания электрических переходов, изолирующих участков. Производится методом диффузии из твёрдых, жидких или газообразных источников, основными диффузантами в кремний являются фосфор и бор.

Термическая диффузия — направленное перемещение частиц вещества в сторону убывания их концентрации: определяется градиентом концентрации. Часто применяется для получения введения легирующих примесей в полупроводниковые пластины (или выращенные на них эпитаксиальные слои) для получения противоположного, по сравнению с исходным материалом, типа проводимости, либо элементов с более низким электрическим сопротивлением.

Ионное легирование (применяемое при изготовлении полупроводниковых приборов с большой плотностью переходов, солнечных батарей и СВЧ-структур) определяется начальной кинетической энергией ионов в полупроводнике и выполняется в два этапа: в полупроводниковую пластину на вакуумной установке внедряют ионы производится отжиг при высокой температуре В результате восстанавливается нарушенная структура полупроводника и ионы примеси

занимают узлы кристаллической решётки.

Получение омических контактов и создание пассивных элементов на пластине — с помощью фотолитографической обработки в слое оксида, покрывающем области сформированных структур, над предварительно созданными сильно легированными областями n+- или p+-типа, которые обеспечивают низкое переходное сопротивление контакта, вскрывают окна. Затем, методом вакуумного напыления всю поверхность пластины покрывают слоем металла (металлизируют),

Page 44: Современные проблемы информатики и вычислительной техники

44 `

излишек металла удаляют, оставив его только на местах контактных площадок и разводки. Полученные таким образом контакты, для улучшения адгезии материала контакта к поверхности и уменьшения переходного сопротивления, термически обрабатывают (операция вжигания). В случае напыления на материал оксида специальных сплавов получают пассивные тонкоплёночные элементы — резисторы, конденсаторы, индуктивности.

Добавление дополнительных слоев металла (в современных процессах — около 10 слоев), между слоями располагают диэлектрик со сквозными отверстиями.

Пассивация поверхности пластины. Перед контролем кристаллов необходимо очистить их внешнюю поверхность от различных загрязнений.

Тестирование неразрезанной пластины. Обычно это испытания зондовыми головками на установках автоматической разбраковки пластин. В момент касания зондами разбраковываемых структур измеряются электрические параметры. В процессе маркируются бракованные кристаллы, которые затем отбрасываются.

Разделение пластин на кристаллы, механически разделяет (разрезанием) пластину на отдельные кристаллы.

Сборка кристалла и последующие операции монтажа кристалла в корпус и герметизация — присоединение к кристаллу выводов и последующая упаковка в корпус, с последующей его герметизацией.

Электрические измерения и испытания проводятся с целью отбраковки изделий, имеющих несоответствующие технической документации параметры. Иногда специально выпускаются микросхемы с «открытым» верхним пределом параметров, допускающих впоследствии работу в нештатных для остальных микросхем режимах повышенной.

Выходной контроль, завершающий технологический цикл изготовления устройства весьма важная и сложная задача (так, для проверки всех комбинаций схемы, состоящей из 20 элементов с 75 (совокупно) входами, при использовании устройства работающего по принципу функционального контроля со скоростью 104 проверок в секунду, потребуется 1019 лет!)

Маркировка, нанесение защитного покрытия, упаковка — завершающие операции перед отгрузкой готового изделия конечному потребителю.

Для выполнения требований электронной производственной гигиены строят особо чистые помещения («чистые комнаты»), в которых люди могут находиться только в специальной одежде

Технологии производства полупроводниковой продукции с субмикронными размерами элементов основана на чрезвычайно широком круге сложных физико-химических процессов:

получение тонких плёнок термическим и ионно-плазменным распылением в вакууме,

механическая обработка пластин производится по 14-му классу чистоты с отклонением от плоскостности не более 1 мкм,

широко применяется ультразвук и лазерное излучение,

используются отжиг в кислороде и водороде,

рабочие температуры при плавлении металлов достигают более 1500 °C, при этом диффузионные печи поддерживают температуру с точностью 0,5 °C,

широко применяются опасные химические элементы и соединения (например, белый фосфор).

Page 45: Современные проблемы информатики и вычислительной техники

45 `

Всё это обусловливает особые требования к производственной гигиене, так называемую «электронную гигиену», ведь в рабочей зоне обработки полупроводниковых пластин или на операциях сборки кристалла не должно быть более 5 пылинок размером 0,5 мкм в 1 л воздуха. Поэтому в чистых комнатах на фабриках по производству подобных изделий все работники обязаны носить специальные комбинезоны. В рекламных материалах Intel спецодежда работников получила название bunny suit («костюм кролика»).

5.4.2 Техпроцессы более 100 нм

3 мкм — техпроцесс, соответствующий уровню технологии, достигнутому Intel в 1979 году. Соответствует линейному разрешению литографического оборудования, примерно равному 3 мкм.

1,5 мкм — техпроцесс, соответствующий уровню технологии, достигнутому Intel в 1982 году. Соответствует линейному разрешению литографического оборудования, примерно равному 1,5 мкм.

0,8 мкм — техпроцесс, соответствующий уровню технологии, достигнутому в конце 1980-х — начале 1990-х годов компаниями Intel и IBM.

0,6 мкм - техпроцесс, достигнутый производственными мощностями компаниями Intel и IBM в 1994—1995 годах.

350 нм — техпроцесс, соответствующий уровню технологии, достигнутому в 1997г ведущими компаниями-производителями микросхем, такими как Intel, IBM, и TSMC. Соответствует линейному разрешению литографического оборудования, примерно равному 0,35 мкм.

250 нм — техпроцесс, соответствующий уровню технологии, достигнутому в 1998г ведущими компаниями-производителями микросхем. Соответствует линейному разрешению литографического оборудования, примерно равному 0,25 мкм. Слоев металла до 6. минимальное количество масок 22.

180 нм — техпроцесс, соответствующий уровню технологии, достигнутому в 1999г. ведущими компаниями-производителями микросхем. Соответствует линейному разрешению литографического оборудования, примерно равному 180-нм. Слоев металла до 6-7. минимальное количество масок 22-24.

130 нм — техпроцесс, соответствующий уровню технологии, достигнутому в 2000г ведущими компаниями-производителями микросхем. Соответствует линейному разрешению литографического оборудования, примерно равному 130-нм.

5.4.3 Техпроцессы менее 100 нм

90 нм — техпроцесс, соответствующий уровню полупроводниковой технологии, которая была достигнута к 2003г. Соответствует линейному разрешению литографического оборудования, примерно равному 90 нм. Технологический процесс с проектной нормой 90-нм часто используется с технологиями напряженного кремния, медных соединений с меньшим сопротивлением, чем у ранее применяемого алюминия, а также новый диэлектрический материал с низкой диэлектрической проницаемостью.

65 нм — техпроцесс, соответствующий уровню технологии, достигнутому к 2004г. ведущими компаниями-производителями микросхем. Соответствует линейному разрешению литографического оборудования, примерно равному 65-70-нм.

50 нм — техпроцесс, соответствующий уровню технологии, достигнутому к 2005г. ведущими компаниями-производителями микросхем. Соответствует линейному разрешению литографического оборудования, примерно равному 50-нм.

45-нм — техпроцесс, соответствующий уровню технологии, достигнутому к 2006г ведущими компаниями-производителями микросхем. Соответствует линейному разрешению литографического оборудования, примерно равному 45-нм. Для микроэлектронной промышленности стал революционным, так как это был первый техпроцесс, использующий технологию high-k/metal gate (HfSiON/TaN в технологии компании Intel), для замены физически себя исчерпавших SiO2/poly-Si.

32-нм — техпроцесс, соответствующий уровню технологии, достигнутому к 2009г. ведущими компаниями-производителями микросхем. Соответствует линейному разрешению литографического оборудования,

Page 46: Современные проблемы информатики и вычислительной техники

46 `

примерно равному 32-нм. Осенью 2009г. компания Intel находилась на этапе перехода к этому новому техпроцессу. С начала 2011г. начали производиться процессоры по данному техпроцессу.

Intel Sandy Bridge.

AMD Bulldozer.

28-нм. В третьем квартале 2010г. на новых мощностях расположенной на Тайване фабрики Fab 12 компании TSMC должен начаться серийный выпуск продукции по 28-нанометровой технологии.

Многоядерные процессоры Snapdragon фирмы Qualcomm.

В мае 2011г. по технологии 28 нм фирмой Altera была выпущена самая большая в мире микросхема, состоящая из 3,9 млрд транзисторов.

22-нм — техпроцесс, соответствующий уровню технологии, достигнутому к 2012г. ведущими компаниями - производителями микросхем. Соответствует линейному разрешению литографического оборудования, примерно равному 22 нм. 22-нм элементы формируются при литографии путем экспонирования маски светом длиной волны 193 нм. Производятся процессоры по такой технологии с начала 2012г.

Intel Ivy Bridge.

Intel Haswell (последователь Ivy Bridge, ожидаются в 2013г.).

14-нм. Завод под названием Fab42 в американском штате Аризона будет сдан в 2013г. По заявлению Intel, он станет самым современным заводом по массовому выпуску компьютерных процессоров — Intel будет выпускать здесь продукцию по 14-нм технологии на основе 300-миллиметровых кремниевых пластин. Завод также станет первым массовым производством, совместимым с 450-мм пластинами. В стройку планируется вложить более $5 млрд. На момент запуска Fab 42 станет, как ожидается, одним из самых передовых в мире заводов по выпуску полупроводниковой продукции в больших объёмах.

10-нм. Планы по выпуску серверных решений и развитию техпроцесса до 2018 года

5.4.4 Техпроцесс атомарного уровня

В 2012г. исследователи из Университета Южного Уэльса представили способ создания транзисторов, размеры которых были бы равны размерам одного атома. Демонстрация способа была произведена на примере атома фосфора, размещённого на полупроводниковом кристалле. Результаты этой работы могут быть положены в основу создания квантовых компьютеров будущего.

5.5 Оптические и квантовые процессоры

Оптический компьютер — компьютер, основанный на использовании оптических процессоров. В отличие от обычных компьютеров, основанных на электронных технологиях, в оптических компьютерах операции выполняются путём манипуляции потоками оптического излучения, что позволяет достичь большей производительности вычислений.

Кубит (q-бит, от quantum bit) — квантовый разряд или наименьший элемент для хранения информации в квантовом компьютере. Как и бит, кубит допускает два собственных состояния.

Кубиты могут быть связаны друг с другом, то есть на них может быть наложена ненаблюдаемая связь, выражающаяся в том, что при всяком изменении над одним из нескольких кубитов остальные меняются согласованно с ним. Иными словами, совокупность запутанных между собой кубитов может интерпретироваться как заполненный квантовый регистр. Как и отдельный кубит, квантовый регистр гораздо информативнее классического регистра битов. Он может не только находиться во всевозможных комбинациях составляющих его битов, но и реализовывать всевозможные тонкие зависимости между ними.

Несмотря на то, что мы сами не можем непосредственно наблюдать состояние кубитов и квантовых регистров во всей полноте, между собой они могут обмениваться своим состоянием и могут его преобразовывать. Тогда есть возможность создать компьютер, способный к параллельным вычислениям на уровне своего физического устройства, и проблемой остаётся лишь прочитать конечный результат вычислений.

Page 47: Современные проблемы информатики и вычислительной техники

47 `

Слово «qubit» ввел в употребление Шумахер из Кеньон-колледжа (США) в 1995 г. Иногда также можно встретить название «квантбит».

Преимущества оптических технологий

Принципиальное повышение производительности.

Возможное уменьшение размеров элементов схем.

Снижается потребляемая мощность.

Можно использовать совершенно разные среды передачи, хранения и обработки информации;

Обработка информации во время ее передачи через оптическую систему, которая реализует вычислительную среду.

Возможность передавать информацию, которая закодирована оптическим лучом, практически без потерь энергии.

Отсутствие вероятности перехвата информации (по оптической технологии в окружающую среду ничто не излучается).

5.5.1 История развития

Рано или поздно кремниевая технология, используемая сегодня для создания процессоров, исчерпает себя, и уже сейчас ей подыскивают замену из биокомпьютеров и квантовых вычислений, а наряду с ними - из оптических компьютеров, о которых и пойдет речь в этой статье.

Работы по созданию оптического процессора начались еще в далеких 80-х годах. Исследователи по оптической электронике начали работать над созданием процессора нового поколения. Оптический процессор должен был использовать специальные элементы, в которых свет управлял бы светом. Логические операции представлены как взаимодействия вещества со светом. В 1990 году фирма Bell создала макет оптического устройства и продемонстрировала выполнение логических и арифметических операций с очень высоким быстродействием.

В 2003г. году компания Lenslet создала первый в мире оптический процессор, причем это была не демонстрационная модель, как созданная в 1990 году, а коммерческий продукт, который можно было купить. Процессор назывался EnLight256, его производительность составляла 8 триллионов арифметических операций в секунду! Операции выполнялись за счет манипуляции потоков света, а не электронов, поэтому и была достигнута такая производительность. Может возникнуть вполне справедливый вопрос: зачем нам такая производительность? Оптические технологию в первую очередь ориентированы (по крайней мере сейчас) на промышленное производство, военную технику, то есть на те области, в которых нужно в реальном времени обрабатывать большие потоки информации и промедление в несколько сотых секунд может закончиться непоправимыми последствиями.

5.5.2 Первые оптические компьютеры

Как уже отмечалось, в 1990 году компания Bell (Bell Labs) создала макет первого оптического компьютера. В основе процессора были положены двухмерные матрицы бистабильных полупроводниковых элементов со множествами квантовых ям. Эти элементы обладали электрооптическими свойствами (в англоязычной литературе можно встретить аббревиатуру SEED - self-electro-optic-effect devices). Освещение элементов производилось полупроводниковым лазером через голографическую решетку Даммена. Мощность излучения лазера составила 10 мВт, длина волны – 850 нм. Свет проходил через один диод, в цепи возникал ток, что в свою очередь приводило к падению напряжения на структуре решетки и к повышению пропускания света через вторую структуру. Так возникала обратная связь и совокупность элементов образовывала логические ячейки ИЛИ-И, ИЛИ-НЕ и т.д.

Первый оптический компьютер занимал 1 кв. метр и состоял из 4 каскадов. На выходе каждого каскада определялось пространственное распределение излучения по состоянию входящей в состав каскада жидкокристаллической маски, которая управлялась обычным компьютером. Во втором поколении оптических компьютеров использовалась векторно-матричная логика. Второе поколение было представлено компьютером DOC-II (digital optical computer).

Page 48: Современные проблемы информатики и вычислительной техники

48 `

Поток данных в компьютере DOC-II излучали 64 модулируемых лазерных диода, длина волны каждого составляла 837 нм. Свет от каждого диода отображался на одну строчку матричного пространственного модулятора, общий размер которого составлял 64 128 элементов. Отдельный элемент матрицы - это не что иное, как брэгговская оптическая ячейка (на основе GaP). Свет, который выходит из модулятора, попадает на целый ряд фотодиодов (128 штук). В секунду компьютер может сделать 0,8192 переключения, при этом на одно переключение затрачивается 7,15 фДж, или около 3000 фотонов.

Разумеется, не все так радужно, и у оптических компьютеров предостаточно своих минусов. Их основной недостаток – неинтегрируемость его компонент. В настоящее время ведутся работы по созданию интегрального модуля оптического компьютера. Компьютер будет называться High Performance Optoelectronic Communication - HPOC. Его опытная модель уже создана.

Что же касается веса, то существующие оптические системы в этом проигрывают и весят больше используемых сейчас чипов.

5.5.3 EnLight 256

Единственный существующий сейчас коммерческий оптический процессор EnLight 256, созданный фирмой Lenslet, уже можно купить. Этот процессор является первым оптическим DSP, который в 3 раза превосходит лучшие электронные DSP. Если говорить точнее, EnLight256 - это гибридный оптический процессор, содержащий преобразователи. Создать полностью оптический компьютер пока слишком дорого. Простая замена ядра с сохранением всех остальных электронных компонент позволяет получить огромный прирост производительности.

Ядро этого процессора - оптическое, а входная и выходная информация представляется в электронном виде. Ядро состоит из 256-ти VCSEL-лазеров, пространственного модулятора света, набора линз и приемников. Производительность процессора составляет 8 триллионов операций в секунду: за один такт (8 нс) процессор умножает 256-байтный операнд на матрицу 256х256.

Организация технологии Lenslet позволяет использовать лучшее из оптического и электрического миров. Оптическая матрица VMM (Vector-Matrix Multiplication), ядро процессора, конвертирует электрическую информацию в свет, затем производит необходимые преобразования этой информации, направляя свет через программируемую внутреннюю оптику. Свет, который появляется на выходе, ощущается множеством датчиков и преобразуется снова в электрический сигнал.

VMM состоит из трех основных элементов:

N некогерентных лазеров, которые представляются как вектор, состоящий из N элементов, каждый элемент - это 8 бит.

Пространственного модулятора Multiple Quantum Well (MQW), состоящего из NxN пикселных модуляторов, размещенных на одном чипе.

Ряда из N детекторов света, которые интегрированы в массив аналогово-светового преобразования (Analog to Digital Converters, ADC). Детекторы установлены так, чтобы получать лучи от матрицы модулятора. Вывод столбца детектора - это вектор-результат.

Каждый элемент входного вектора проектируется на столбец матрицы. Каждый ряд матрицы проектируется на один детектор в векторе результата (вывода).

Программирование оптического цифрового сигнального процессора (Optical Digital Signal Processing Engine, ODSPE) заключается в изменении значений, которые сохранены в пространственном модуляторе (Spatial Light Modulator, SLM). Загрузка приложения (или данные внутри приложения) аналогична замене матрицы в пространственном модуляторе. Можешь догадаться сам, как быстро это происходит. Кстати, пространственный модулятор может поставляться как отдельный продукт, так что ничто не помешает тебе (наверное, кроме отсутствия нужных средств) создать свой оптический процессор. Этот модулятор называется Ablaze, и о нем можно прочитать на сайте компании Lenslet.

EnLight256 уже сейчас широко используется. Основные сферы его применения - это военная промышленность и обработка видео в реальном времени. Эти сферы требуют высокой производительности.

Page 49: Современные проблемы информатики и вычислительной техники

49 `

5.5.4 Разработка технологии и компонентов

2008г. - исследователи из компании IBM представили оптический коммутатор, который обеспечивает пакетную передачу данных со скоростью более 1 Тбит/сек.

2009г. - профессорами Массачусетского технологического института Стояновичем и Ремом было предложено использовать для создания оптоэлектронных устройств, в том числе и оптических процессоров, обычный технологический процесс изготовления полупроводниковых процессоров, основанный на 32-нм технологии. По их расчётам это позволит достигнуть большего прогресса.

Page 50: Современные проблемы информатики и вычислительной техники

50 `

6 Разработчики и производители средств ВТ

На конкурентном рынке присутствует множество компаний. Некоторые имеют успех во многих различных областях информатики и ВТ. Другие концентрируют усилия в отдельных областях. Ниже рассмотрены основные компании.

6.1 Intel

Intel—американская корпорация, производящая широкий спектр электронных устройств и компьютерных компонентов, включая микропроцессоры, наборы системной логики (чипсеты) и др. Штаб-квартира — в Санта-Клара (штат Калифорния, США).

Компанию основали Роберт Нойс и Гордон Мур 18 июля 1968 года после того, как ушли из компании Fairchild Semiconductor. К ним вскоре присоединился Энди Гроув. Бизнес-план компании был распечатан на печатной машинке Робертом Нойсом и занимал всего одну страницу. Представив его финансисту, который ранее помог создать Fairchild, Intel получила стартовый кредит в $2,5 млн.

Успех к компании пришёл в 1971, когда Intel начал сотрудничество с японской компанией Busicom. Intel получил заказ на 12 специализированных микросхем, но по предложению инженера Тэда Хоффа компания разработала один универсальный микропроцессор Intel 4004. Следующим был разработан Intel 8008.

В 1990-е компания стала крупнейшим производителем процессоров для персональных компьютеров. Серии процессоров Pentium и Celeron до сих пор являются самыми распространёнными. Intel внесла существенный вклад в развитие компьютерной техники. Достаточно сказать, что спецификации на все порты, шины, системы команд написали компании работающие совместно с Intel или сама Intel.

Intel — крупнейший в мире производитель микропроцессоров, занимающий на 2008г. 75 % этого рынка. Основные покупатели продукции компании — производители персональных компьютеров Dell и Hewlett-Packard. Помимо микропроцессоров, Intel выпускает полупроводниковые компоненты для промышленного и сетевого оборудования.

Выручка компании в 2011г. — $53,99 млрд., чистая прибыль — $12,94 млрд..

6.2 Freescale

Freescale — американская компания, занимающаяся производством полупроводниковых компонентов. Это одна из первых компаний в этом секторе, появившаяся в 1949 как подразделение Моторолы. В 2004г. сектор разработки и производства полупроводниковых приборов компании («Motorola Semiconductor») был выделен в отдельную компанию.

Freescale занимается производством полупроводниковых компонентов для автомобилей, встраиваемых систем, а также для коммуникационного оборудования. Freescale входит в мировую 20 крупнейших поставщиков полупроводниковых компонентов.

6.3 Samsung

Samsung Group — промышленный концерн (группа компаний), один из крупнейших в Южной Корее, основанный в 1938 . На мировом рынке известен как производитель высокотехнологичных компонентов, телекоммуникационного оборудования, бытовой техники, аудио- и видео устройств.

Слово «Самсунг» (более правильная передача слова по нормам практической транскрипции — «самсон») в корейском языке означает «три звезды».

Основание компании.

В 1930-х годах в Корее предприниматель Ли Бён Чхоль открывает своё дело по производству рисовой

муки. Небольшой склад в городе Тэгу становится началом большой истории компании Samsung.

Иностранное (для Кореи) происхождение названия явилось следствием далеко идущих, амбициозных

планов корейского предпринимателя.

Page 51: Современные проблемы информатики и вычислительной техники

51 `

Президент Южной Кореи генерал Пак Чон Хи начал промышленные и экономические реформы. Была разработана программа развития промышленного сектора экономики, повышенная ориентация на экспорт была подкреплена тесными отношениями с США, предполагалось брать иностранные займы, приобретать сырьё и современные технологии, а полученную прибыль вновь пускать на приобретение сырья и техники. Корейские реформаторы сделали вывод, что стабильная экономика должна опираться на крупные концерны, но создавать таковые необходимо было в кратчайшие сроки, поэтому самым выдающимся бизнесменам Кореи были предоставлены правительственные кредиты и займы. Они были обеспечены государственными заказами, при этом определённые правовые и налоговые послабления дали возможность вырасти маленьким предприятиям до обширных конгломератов. Среди удачливых предпринимателей оказался и Ли Бён Чхоль.

Были созданы 30 крупных компаний. Среди них, помимо Samsung, были Daewoo,Hyundai, Goldstar (LG) и др. У каждой «денежной семьи» было своё направление: Daewoo — производство автомобилей, у Goldstar — бытовая техника, у Samsung — электроника, Hyundai — строительство и т. д.

Экономика Южной Кореи развивалась стремительными темпами от 6 до 14 % в год. Прирост экспорта в этот период составил 30 %. Так что в 1969 году, когда компания Samsung, после объединения с Sanyo, начала производство чёрно-белых телевизоров, в самой Корее они были только у 2 % жителей.

Были введены маркетинговые изменения, полная переработка миссии компании и изменение её символа. На двух первых логотипах компании присутствовали три красные звезды.

Но руководство Samsung, посчитав прежний логотип не соответствующим имиджу международной корпорации решилось на его замену. Именно тогда увидела свет современная эмблема — динамично наклоненный синий эллипс с написанным внутри названием фирмы. Отличный дизайн и масштабная рекламная кампания сделали своё дело: логотип стал одним из самых узнаваемых в мире.

В 1983 было открыто производство персональных компьютеров. В 1991—1992 завершилась разработка первого производства персональных мобильных устройств и мобильной телефонии. И, наконец, в 1999г премия журнала Forbes Global в сфере производства бытовой электроники была присуждена компании Samsung Electronics.

По данным маркетинговых исследований, ежегодно проводимых консалтинговой компанией Interbrand, Samsung находится на 21 месте по суммарной стоимости бренда, по состоянию на 2007г.. Основной конкурент компания Sony — 25-е место.

6.4 Qualcomm

Qualcomm — компания по разработке и исследованию беспроводных средств связи, расположенная в Сан-Диего, Калифорния, США. Компания основана в 1985 Якобсом, Антонио и др.

Компания сосредоточилась на разработке и лицензировании технологий беспроводной связи, а также производстве ASIC реализующих эти технологии.

Процессор Qualcomm. В 2005г., лицензировав у компании ARM её процессорное ядро Cortex A8, компания Qualcomm разработала на его основе собственный микропроцессор для мобильных телефонов на ядре Scorpion. Чип полностью поддерживает набор инструкций ARMv7, используемый в Cortex A8, но является доработанным по сравнению с базовым ядром ARM. Scorpion работает на более высокой частоте, 1 ГГц и потребляет при этом вдвое меньше электроэнергии. Процессор выпускается по технологии 65-нм.

Page 52: Современные проблемы информатики и вычислительной техники

52 `

Сейчас осуществляется переход от архитектуры Scorpion на ядро Krait. Новые чипы будут производитьсяпо 28-нм техпроцессу, что позволит поднять тактовую частоту 1-ядерных моделей до 2,5ГГц. Серия включает 1, 2 и 4-ядерные процессоры. Чипы нового поколения получат встроенное графического ядро Adreno 220, которое заменит нынешнее Adreno 205. Новые Snapdragon будут поддерживать Wi-Fi, GPS, Bluetooth, 3D-видео и NFC (near field communication).

Портфолио Qualcomm чрезвычайно обширно. Первые мобильные "системы на кристалле" под маркой Snapdragon появились ещё в 2008г. году, когда была выпущена платформа S1. Сегодня, в 2012г., перед нами серия S4, представляющая уже четвёртое поколение микросхем

S4 Play S4 Plus S4 Pro S4 Prime

ЦП 2 ядерный ARM Cortex A5 до 1,2 ГГц

2 ядерный Krait до 1,7 ГГц

2 или 4 ядерный Krait до 1,7 ГГц

4 ядерный Krait до 1,7 ГГц

ГрафП Adreno 203 вплоть до Adreno 305 Adreno 320 Adreno 320

Видео FWVGA до 1080p HD 1080p HD 1080p

Связь 3G/4G/LTE 3G/4G/LTE 3G/4G/LTE 3G/4G/LTE

Камера 8 Мпикс до 20 Мпикс, набор для 3D

до 20 Мпикс, набор для 3D

до 20 Мпикс, набор для 3D

GPS gpsOne Gen7 gpsOne Gen8A gpsOne Gen8A gpsOne Gen8A

USB 2.0 High Speed 2.0 High Speed OTG (480 Мбит/с)

2.0 High Speed OTG (480 Мбит/с)

2.0 High Speed OTG (480 Мбит/с)

Bluetooth дискретный чип 3.x встроенный 4.0* встроенный 4.0* встроенный 4.0*

Wi-Fi дискретный чип 802.11n (2,4 ГГц)

встроенный 802.11n (2,4/5 ГГц)*

встроенный 802.11n (2,4/5 ГГц)*

встроенный 802.11n (2,4/5 ГГц)*

Техпроцесс 45 нм 28 нм 28 нм 28 нм

Под общим названием Qualcomm S4 скрываются 4 семейства продуктов, каждое из которых состоит из отдельных кристаллов, ориентированных на различное применение.

К примеру, S4 Prime позиционируется в качестве решения для "умных" TB и телевизионных приставок. MPQ8064 – единственный, входящий в эту серию, и он может похвастаться 4-ядерным ядром с микроархитектурой Krait и графическим ускорителем Adreno 320.

Семейство Snapdragon S4 Pro, включает в себя 2 разных микросхемы, MSM8960T и APQ8064. Первая из них представляет собой 2-ядерный процессор Krait, а вторая – 4-ядерный. Оба чипа выполнены по 28-нм технологии и снабжены одинаковой графикой высшего класса Adreno 320. При этом модель MSM8960T дополнительно снабжена встроенным модулем 3G/4G/LTE, который отсутствует в APQ8064.

MSM8960 / MSM8960T / MSM8660A / APQ8060A (S4)

Архитектура: RISC, 32 bit.

Набор инструкций: ARM v7.

Ядро: Qualcomm Krait.

Количество ядер: 2.

Рабочая частота: 1500…1700 МГц.

Графический сопроцессор: Adreno 225 (MSM8960, MSM8660A, APQ8060A) Adreno 320 (MSM8960T).

Техпроцесс: 28 нм, CMOS

Из процессоров семейства S4, MSM8960 в готовых устройствах встречается наиболее часто. В частности он стал основой HTC One XL и американского варианта HTC One X (в европейской версии One X используется 4-ядерный NVIDIA Tegra 3). Вообще MSM8960 уже достаточно часто встречается в LTE-устройствах, выпущенных для японского и американского рынка.

Page 53: Современные проблемы информатики и вычислительной техники

53 `

Впрочем, производительности даже MSM8260 в подавляющем большинстве задач вполне достаточно, а увидеть разницу в производительности «на глаз» между современными hi-end мобильными платформами довольно сложно.

MPQ8064 / APQ8064 (S4)

Архитектура: RISC, 32 бита.

Набор инструкций: ARM v7.

Ядро: Qualcomm Krait.

Количество ядер: 4.

Рабочая частота: 1500…1700 МГц.

Графический сопроцессор: Adreno 320.

Техпроцесс: 28 нм, CMOS.

Устройства, построенные на базе этих процессоров, поступят на рынок к концу 2012г. и будут ориентированы на многопоточные ресурсоемкие приложения, в том числе игры, способные загрузить 4 ядра. При этом MPQ8064, как уже упоминалось, нацелен на мультимедийные устройства.

Семейства S4 Plus и S4 Play, предназначенные для смартфонов и планшетов, состоят из 14 различных "систем на чипе" со встроенными модулями беспроводной связи и без них.

Микросхемы Snapdragon S4 Pro занимают высшее положение в иерархии чипов Qualcomm S4, предназначенных для мобильных устройств, поэтому неудивительно, что в основу платформы для разработчиков, которую мы приобрели для нашей лаборатории, был положен чип APQ8064

И хотя формально микросхемы Snapdragon S4 Pro лишь вторые в "табели о рангах" линейки S4, эти системы, безусловно, относятся к высокопроизводительным. APQ8064 построен на основе 4-ядерного центрального процессора Krait, работающего на тактовой частоте от 1,5 до 1,7 ГГц. В Qualcomm не смогли предоставить нам блок-схему именно чипа APQ8064, поэтому представьте себе, что на схеме MSM8960 появились 2 дополнительных ядра, а модуль связи стал намного меньше (только Wi-Fi и Bluetooth, без доступа к сотовым сетям).

Page 54: Современные проблемы информатики и вычислительной техники

54 `

Каждое ядро Krait снабжено 16 Кбайтами кэш-памяти L1 для данных и 16 Кбайтами L1 для инструкций, и каждые два ядра делят общий кэш второго уровня объёмом 1 Мбайт. Вычислительные ядра Qualcomm Krait унаследовали основные особенности архитектуры Scorpion

Сравнение архитектур.

Cortex-A9 Cortex-A15 Scorpion Krait

Длина конвейера 8 ступеней 15/17-24 ступени (целочисленный, с ПТ

10 ступеней 11 ступеней

Внеочередное исполнение инструкций

Да Да Частично Да

Техпроцесс 45/30/32 нм 32/28 нм 65/45 нм 28 нм

Число ядер 1/2/4 2/4 1/2 2/4

Кэш-память L1: 32+32 Кбайт L2: 1 Мбайт

L1: 32+32 Кбайт L2: до 4 Мбайт

L1: 32+32 Кбайт L2: 256 Кбайт (на ядро)

L1: 16+16 Кбайт L2: 1 Мбайт (на два ядра)

DMIPS/МГц 2,5 3,5 2,5 3,3

В отличие от многих конкурентов, компания Qualcomm тратит множество времени и вкладывает значительные средства в разработку собственных процессорных ядер на базе ARM. К примеру, в основу конструкции Scorpion положена та же самая архитектура ARM v7-A, что используется в ядрах Cortex-A8 и Cortex-A9. Однако в варианте Qualcomm конвейер исполнения инструкций разбивается на иное число ступеней, применяется внеочередное исполнение инструкций и обеспечивается поддержка 128-битных SIMD-команд. Благодаря столь существенным доработкам, Scorpion заметно отличается от стандартного Cortex-A9, и это помогает объяснить некоторые его победы в тестах производительности.

В ядре Krait была ощутимо повышена скорость работы за счёт усложнения архитектуры (плюс более тонкий 28-нм техпроцесс). Каждое ядро теперь может декодировать до 3 инструкций за такт (по сравнению с 2 в Scorpion) – как и чип ARM Cortex-A5. Конвейер целочисленных операций в Krait состоит из 11 ступеней – на одну длиннее, чем у Scorpion, но не настолько длинный, как 15-ступенчатый конвейер A15. На практике, более длинный конвейер означает возможность добиться более высокой тактовой частоты.

Инженеры Qualcomm также реализовали в Krait возможность работы каждого ядра на различных тактовых частотах, что улучшает показатели энергосбережения в приложениях, когда не требуются вычислительные ресурсы всех ядер "системы на чипе".

6.5 Texas Instruments

Texas Instruments (TI) — американская компания, производитель полупроводниковых элементов, микросхем, электроники и изделий на их основе. Расположена в Далласе (Техас, США).

Является 4-м в мире по размерам производителем полупроводниковых приборов, уступая лишь Intel, Samsung и Toshiba. Занимает 1-е место по производству микросхем для мобильных устройств, а также 1-е место по производству DSP и аналоговых полупроводников. Также компания производит микросхемы для широкополосных модемов, компьютерной периферии, электронные бытовые устройства и RFID-чипы.

TI была основана Грином, Джонсоном, Макдермоттом и Хэггерти.

В 1954 компания разработала первый в мире серийный транзисторный радиоприёмник (выпускался под названием Regency TR-1).

В 1950-х работник TI Килби изобрёл интегральные микросхемы (ИС) независимо от Нойса из Fairchild.

Page 55: Современные проблемы информатики и вычислительной техники

55 `

В 1967г TI изобрела программируемый калькулятор, в 1971г однокристальный микрокомпьютер и способствовала получению патента на однокристальный микропроцессор, разработанный сотрудником TI Буном в 1973г.

TI была активным игроком на рынке бытовой электроники в 1970—1980-х годах. В 1978г TI представила первый синтезатор речи на однокристальной микросхеме.

В июне 1979г TI вышла на рынок бытовых компьютеров с моделью TI99/4, ставшей конкурентом Apple II. В 1981г на замену ему был выпущен TI99/4A, являвшийся дальнейшим его развитием, и в конце 1983г вступивший в интенсивную ценовую конкуренцию с остальными.

TI всегда была в числе 10 самых больших компаний по продаже полупроводниковой техники. По итогам 2005г компания заняла 3 место, пропустив вперёд Intel и Samsung и оставив позади Toshiba.

Цифровые сигнальные процессоры (DSP).

TI производит широкий круг DSP и набор инструментов под названием eXpressDSP, использующийся для разработки приложений для этих микросхем.

Серия TMS320

TMS320C2xxx — 16-и и 32-х битные DSP, оптимизированные для применения в схемах управления. C24X — работает на частотах от 20 до 40 МГц; C28X — работает на частотах от 100 до 300 МГц;[8]

TMS320C5xxx — 16-битный целочисленный DSP (от 50 до 300 МГц) с пониженным энергопотреблением.[источник не указан 1113 дней]

TMS320C6xxx — семейство высокопроизводительных DSP, от 300 до 1200 МГц. Включает в себя семейства целочисленных DSP C62xx, C64xx и DM64x и семейство,

выполняющее вычисления с плавающей точкой, C67xx.

Прочие: TMS320C33, TMS320C3x, TMS320C4x, TMS320C5x и TMS320C8x — многопроцессорные DSP.

Микроконтроллеры и процессоры общего применения.

MSP430 — наиболее удачный опыт TI в сфере микроконтроллеров общего применения. Уже более 10 лет эта линейка является безусловным лидером в сегменте микропотребляющих микроконтроллеров общего применения.

TMS470 — неудачная попытка сделать линейку однокристальных микроконтроллеров на базе архитектуры ARM7. В 2010г. продукты сняты с производства в связи с покупкой Luminary Micro и ставкой на ее линейку ARM микроконтроллеров Stellaris.

Stellaris — новая попытка утвердиться на рынке 32-битных микроконтроллеров общего применения.

TMS570 — линейка процессоров общего применения на базе ядра ARM Cortex.

Многоядерные процессоры.

OMAP — микропроцессоры, предназначенные для мультимедийных приложений. Некоторые из них содержат процессорные ядра C55, ARM7, ARM9, ARM11, A9, A15.

DaVinci — микропроцессоры, содержащие ядро C64, ARM9 и специализированную периферию для обработки видеоданных.

6.6 Analog Devices

Analog Devices — крупная американская компания, производитель интегральных микросхем для решения задач преобразования сигналов (в том числе аналого-цифровых преобразователей и цифровых сигнальных процессоров).

Компания основана в 1965 двумя выпускниками МИТ Стейтом и Лорбером. Штаб-квартира компании находится в Норвуде (.Массачусетс, США). Кроме того, несколько офисов компании размещено в других частях США. Фабрики компании расположены в США и Ирландии.

Page 56: Современные проблемы информатики и вычислительной техники

56 `

Компания имеет исследовательские центры в Великобритании, Австралии, Германии, Испании, Израиле, Китае, Японии, Тайване и Индии.

Продукция

Усилители и компараторы.

Аналого-цифровые преобразователи.

Цифро-аналоговые преобразователи.

Цифровые сигнальные процессоры: ADSP-21xx, Blackfin, SHARC, TigerSHARC.

Микросхемы для обработки аудио и видео сигналов.

Микросхемы для генерации и распространения сигналов синхронизаци.и

Источники опорного напряжения.

Цифровые вычислительные синтезаторы.

6.7 Apple

Производитель персональных и планшетных компьютеров, аудиоплееров, телефонов, ПО. Один из пионеров в области персональных компьютеров и современных многозадачных операционных систем с графическим интерфейсом. Штаб-квартира — в Купертино (Калифорния, США).

Благодаря инновационным технологиям и эстетичному дизайну, корпорация Apple создала уникальную репутацию, сравнимую с культом, в индустрии потребительской электроники. В 2011г. торговая марка Apple была признана самым дорогим брендом в мире (c оценкой в $153,3 млрд.) в рейтинге международного исследовательского агентства Millward Brown.

Название фирмы происходит от apple (яблоко), изображение яблока использовано в логотипе. До 9 января 2007г. официальным названием корпорации было «Apple Computer». Отказ от слова Computer вназвании демонстрирует смену основного фокуса корпорации с традиционного для неё рынка компьютерной техники на рынок бытовой электроники.

Имя Apple предложил Джобс.

Macintosh — сорт яблок, продававшийся в США — любимый сорт яблок Раскина, который был руководителем и разработчиком проекта Macintosh перед тем, как эту должность занял Джобс.

Основана Стивом Джобсом и Стивом Возняком, собравшими в середине 1970-х свой первый персональный компьютер на базе процессора «MOS Technology 6502». Продав несколько десятков таких компьютеров, молодые предприниматели получили финансирование и официально зарегистрировали фирму 1 апреля 1976 года.

В 1976—1977 несколькими фирмами были выпущены первые персональные компьютеры, Но первым массовым персональным компьютером, выпускавшимся миллионами экземпляров, стал компьютер Apple II. Теперь принято считать, что именно «Apple II» раз и навсегда открыл широкую дорогу перед новой индустрией — производством персональных компьютеров.

Традиционно «Apple» имела сильные позиции в сегментах правительственных и образовательных организаций, а также в издательском бизнесе и дизайне, впоследствии в музыкальной индустрии. Раньше других разработчиков «Apple» ввела в широкий обиход графический интерфейс пользователя и компьютерную мышь. В 1985г президент США Рональд Рейган наградил Джобса и Возняка медалями за развитие технического прогресса. В том же году компанию покинул один из основателей, Стив Джобс.

С возвращением в 1997г Джобса. Apple стала постепенно открывать для себя новые, не связанные непосредственно с компьютерной техникой, рынки. В 2001г. году компания представила аудиоплейер iPod, быстро приобретший популярность, а в 2007г. вышла на рынок мобильной телефонии с сенсорным смартфоном iPhone. В 2010г. на рынок был выпущен планшетный компьютер iPad.

Производство этих новинок, пользовавшихся высоким спросом по всему миру, кардинальным образом улучшило финансовое положение Apple, принося компании рекордную прибыль. В начале августа 2011г. года Apple стала самой дорогой компанией мира по рыночной капитализации ($338,8 млрд.), обогнав нефтяную компанию ExxonMobil.

Page 57: Современные проблемы информатики и вычислительной техники

57 `

По состоянию на 9 февраля 2012г. капитализация Apple достигла отметки в $456 млрд. Это превышает общую стоимость ближайших конкурентов Apple - Google и Microsoft, вместе взятых. 29 февраля 2012г. года рыночная капитализация американской компании превысила $500 млрд.

Продукция. В данный момент среди основных продуктов, выпускаемых компанией Apple:

iPhone — мобильные телефоны;

iPad — планшетные компьютеры;

MacBook Pro — профессиональные ноутбуки, с 2006г.;

MacBook Air — ультратонкие ноутбуки, с 2008г.;

Apple TV — мультимедийные проигрыватели, Magic Mouse, Magic Trackpad и др.

По состоянию на 16 октября 2012г. года компания получила 5440 патентов, в том числе изобретений 4480, дизайнерских проектов 914.

6.8 ARM

ARM (Advanced RISC Machines) британская корпорация, один из крупнейших разработчиков и лицензиаров архитектуры 32-разрядных RISC-процессоров (ARM), ориентированных на использование в портативных и мобильных устройствах (телефонах, органайзерах и т. п.).

ARM не является производителем микропроцессоров , однако лицензирует собственную технологию третьим фирмам, таким как Atmel, Intel, , Samsung, Qualcomm, Sony Ericsson, Texas Instruments, Broadcom, HiSilicon Technologies, которые и воплощают её в чипах.

Технология ARM оказалась весьма успешной и в настоящее время является доминирующей микропроцессорной архитектурой для портативных цифровых устройств. ARM утверждает, что общий объём микропроцессоров, произведённых по их лицензии, превышает 2,5 млрд. Только за 2011г. количество лицензированных ядер оценивалось в 7,9 млрд.

В настоящее время известны несколько семейств микропроцессоров ARM:

ARM7 (с тактовой частотой до 60-72МГц, предназначенные для недорогих мобильных телефонов),

ARM9 (с частотами порядка 200МГц для продвинутых телефонов и карманных компьютеров),

ARM9E,

Достаточно производительными являются процессоры семейства ARM11 с тактовой частотой до 1ГГц и расширенными возможностями для ЦОС.

В 2010г. производитель анонсировал процессоры Cortex-A15 под кодовым названием Eagle, производительность которых должна в несколько раз превысить предшественника — ARM Cortex-A9, при сохранении показателя энерго эффективности. Изделие, изготовленное по 28-нм техпроцессу, имеет 4 ядра, может функционировать на частоте до 2,5ГГц и будет поддерживаться многими современными операционными системами. В 2012г. компания сообщила о доступности изделия для заказа.

Процессоры архитектуры ARM по лицензии, полученной от компании, выпускают следующие компании: Apple, Atmel, Broadcom, Freescale, Nvidia, Qualcomm, Samsung, Texas Instruments, VIA и др.

6.9 Atmel

Atmel - изготовитель полупроводниковых электронных компонентов. Компания основана в 1984. Один из лидеров производства микроконтроллеров (MCS-51, ARM, AVR, AVR32). Также разрабатывает и производит небольшие модули энергонезависимой памяти для электронных изделий, ПЛИС, цифровые микросхемы-радиоприёмники и передатчики, сканеры отпечатков пальцев. Компания для своих клиентов может предложить систему на кристалле, объединяющую затребованные компоненты.

Продукция Atmel широко применяется в компьютерных сетях, промышленности, медицине, связи, автомобилях, космосе, военных устройствах, а также кредитных картах.

Первый микроконтроллер Atmel появился в 1993н и был основан на классическом микроконтроллерном ядре Intel 8051. Продукция Atmel включает микроконтроллеры MCS-51, AT91SAM и AT91CAP (основаны

Page 58: Современные проблемы информатики и вычислительной техники

58 `

на ядре ARM), микроконтроллеры на их собственных ядрах Atmel AVR и AVR32, радиочастотные (RF) устройства, микросхемы памяти типов EEPROM и флеш (включая память, основанную на DataFlash), и некоторое количество других продуктов этой же отрасли.

6.10 Altera

Altera — одна из крупнейших разработчиков ASIC, программируемых логических интегральных схем (ПЛИС), была основана в 1983н. Как предприятие без собственного производства Altera концентрируется на разработке схем и модулей на основе таких языков описания аппаратуры, как VHDL, Verilog и собственный AHDL. В области производства микросхем сотрудничает с различными производителями.

Основные изделия — это программируемые микросхемы, а также услуги по преобразованию проектов под ПЛИС в ASIC для массового производства. Компания также выпускает программы для разработки встроенного программного обеспечения для ПЛИС, а также компиляторы под ядро процессора собственной разработки.

В 2011г. фирмой Altera была выпущена, по технологии 28-нм самая большая в мире микросхема, состоящая из 3,9 млрд. транзисторов.

6.11 Atheros

Qualcomm Atheros — производитель полупроводников для сетевых коммуникаций и беспроводных чипсетов.

Atheros Communications. была основана в 1998г экспертами в обработке сигналов из Стэнфордского университета, Калифорнийского университета в Беркли и частного бизнеса.

5 января 2011г. было объявлено, что Qualcomm согласилась поглотить компанию Atheros Communications. за оценочную стоимость в $3,5 млрд. Покупка была завершена 24 мая 2011г и Atheros стала подразделением Qualcomm, получив имя Qualcomm Atheros.

Чипсеты Atheros для стандарта IEEE 802.11 используются более чем 30 различными производителями беспроводных устройств, включая D-Link, Compex, Netgear и TRENDnet.

6.12 Microchip

Microchip— американский производитель микроэлектроники, 8-и, 16-и и 32-битных микроконтроллеров, цифровых сигнальных контроллеров, а также аналоговой и интерфейсной продукции.

Компания Microchip была основана в 1987 концерном General Instrument. Почти100% полупроводниковых пластин производятся на собственных фабриках в штатах Аризона и Орегон (США)

Микроконтроллеры. Одним из основных направлений является производство контроллеров семейства PIC, которое представлено 8-и, 16-и и 32-битными микроконтроллерами и цифровыми сигнальными контроллерами dsPIC. Номенклатура насчитывает более 500 различных контроллеров со всевозможными вариациями периферии.

Интерфейсные микросхемы. Компания производит следующие интерфейсные микросхемы:

CAN-контроллеры: (CAN-расширители портов ввода-вывода (до 8 I/O, 2 ШИМ), SPI-контроллеры для реализации протокольного уровня CAN, контроллеры физического уровня CAN, в соответствии стандарту ISO-11898),

IrDA-контроллеры (UART — протокольный и физический уровень IrDA),

LIN-контроллеры (UART — LIN контроллеры со встроенным регулятором напряжения),

последовательные расширители портов ввода-вывода (I2C или SPI до 16 дополнительных I/O),

ЖКИ-драйверы (3-проводной интерфейс с управляющим микроконтроллером, до 32-х сегментов ЖКИ),

Ethernet-контроллеры в соответствии со стандартом IEEE 802.3 10Base-T (интерфейс SPI для связи с управляющим микроконтроллером) и 10/100Base-T (интерфейс SPI, параллельный интерфейс PSP для связи с управляющим микроконтроллером),

Page 59: Современные проблемы информатики и вычислительной техники

59 `

интерфейсные микросхемы для НЧ беспроводной связи (PKE) для построения систем беспроводного доступа (транспондерных систем).

6.13 Nokia

Nokia— финская транснациональная компания, поставщик оборудования для мобильных, фиксированных, широкополосных и IP-сетей. Известна мобильными телефонами и смартфонами. Штаб-квартира компании находится в Эспоо, городе-спутнике Хельсинки.

Началом истории компании считается 1865, когда горный инженер Идестам основал в Тампере, на юго-западе Финляндии, небольшую бумажную фабрику. Компания получила своё имя по названию реки, где Идестам построил в 1868г свою фабрику.

С начала 1980-х Nokia начала активно развивать разработку и производство электроники, чему способствовала покупка ряда электронных компаний. В 1987г основным бизнесом компании становится бытовая электроника, в частности Nokia стала 3-им производителем телевизоров в Европе.

В конце 1980-х Nokia попала в кризисное состояние, чему способствовал общий спад мировой экономики. Кризис был преодолён реструктуризацией бизнеса, отказом от большинства видов деятельности и фокусировкой на новых технологиях — в частности, развитием телекоммуникационного подразделения. Эта стратегия позволила компании стать крупнейшим в мире производителем сотовых телефонов: доля рынка Nokia в 2009г. оценивалась в 39%.

Завод Nokia в Сало (Финляндии) будет полностью закрыт осенью 2012г. Переговоры по сокращению персонала затронули 780 работников предприятия. Последний мобильный телефон сошел с производственного конвейера в Сало 25 июля. Таким образом, все производственные мощности мобильного сектора компании с 2012г. сосредоточились только в странах Азии.

В декабре 2012г. руководство Nokia приняло решение продать свою штаб-квартиру компании Exilion Capital за €170 млн. и взять её же в аренду в рамках политики высшего руководства по избавлению от непрофильных активов.

Смена платформы. 12 августа 2009г. Nokia и Microsoft заключили соглашение о партнёрстве. В рамках соглашения разработчики Nokia и Microsoft приступают к созданию Microsoft Office Mobile и корпоративных инструментов связи для смартфонов Nokia, работающих под управлением операционной системы Symbian. Данные решения будут доступны на широком круге устройств, начиная с бизнес-смартфонов серии E. В дальнейшем планируется выпускать новые совместные продукты

11 февраля 2011г. Nokia объявила о полноценном сотрудничестве с Microsoft, решив использовать для своих мобильных устройств операционную систему Windows Phone. Эта платформа должна стать главной составляющей стратегии смартфонов Nokia.

26 октября 2011г. состоялась презентация первых телефонов Nokia на базе операционной системы Windows Phone 7 — смартфонов Nokia Lumia 800 и 710, а позднее, в начале 2012г. — ещё 2 смартфона из этой серии, Nokia Lumia 900 и 610.

5 сентября 2012г. на презентации Nokia World 2012г. были представлены новые устройства на базе Windows Phone 8 - смартфоны Nokia Lumia 920 и 820.

Компания выпускает мобильные устройства для всех основных стандартов мобильной связи, включая GSM, CDMA и UMTS. У компании имеется 15 фабрик, расположенных в Финляндии, Венгрии, Румынии, Китае, Бразилии, Великобритании и др.

Совместное предприятие Nokia и Siemens, Nokia Siemens Networks, производит оборудование, сервисы и другие решения для построения телекоммуникационных систем.

Компания ведёт серьёзную научно-исследовательскую работу: на декабрь 2009г. в исследовательских центрах Nokia, расположенных в 16 странах, были заняты 37 тыс. человек.

Общая численность персонала Nokia — 113,5 тыс. человек (2012г.).

Показатели деятельности.

Page 60: Современные проблемы информатики и вычислительной техники

60 `

В 2010г. занимала 32% мирового рынка мобильных устройств, годом ранее — 34%. В 2011г. году доля в мировом производстве уменьшилась до 31%.

В 2011г. . продажи Nokia упали. Падение произошло на фоне роста рынка смартфонов на 60%. В результате доля Nokia в данном сегменте упала с 29% до 12%. Падение продаж зафиксировано и на рынке телефонов: в 2011г. .реализовано 417 млн. телефонов, тогда как в 2010г. — 452 млн.

6.14 Nvidia

NVIDIA— американская компания, один из крупнейших разработчиков графических ускорителей и процессоров для них, а также наборов системной логики. Название компании основано на игре слов: envidia по-испански означает "зависть".

Компания была основана в 1993. По состоянию на август 2006г. в корпорации насчитывалось более 6 тысяч сотрудников, работающих в 16 офисах по всему миру. Штаб-квартира компании находится в городе Санта-Клара (штат Калифорния, США).

6.15 Sun Microsystems (Oracle Corporation)

Sun Microsystems — американская компания, производитель программного и аппаратного обеспечения, основана в 1982г, В январе 2010г. была поглощена корпорацией Oracle. Штаб-квартира компании располагалась в Санта-Кларе (Калифорния, США).

SUN — акроним от Stanford University Networks, при этом использовалось словесное написание Sun (Солнце) — с прописными буквами. Логотип Sun представляет собой амбиграмму. На нём можно прочитать слово «Sun» в 4 различных направлениях. Создан профессором Стэнфордского университета Вэном Праттом. Слоган компании — «The Network is the Computer» («Сеть — это Компьютер»).

Являлась одним из крупнейших производителей серверов и рабочих станций на базе RISC-процессоров SPARC собственной разработки, серверов стандартной х86-архитектуры на базе микропроцессоров Opteron (AMD) и микропроцессоров Xeon (Intel); известна как разработчик таких технологий как NFS и Java, а также поддерживала программное обеспечение с открытым исходным кодом, в частности OpenSolaris, OpenOffice и MySQL. Также в продуктовом портфеле компании были системы хранения и программное обеспечение (операционная система Solaris и средства разработки). Производственные мощности компании располагались в городе Хиллсборо (штат Орегон, США) и Линлитгоу (Шотландия)..

Самый первый прототип того, что потом стало первой рабочей станцией компании Sun, был разработан Бехтольшеймом, когда он был аспирантом Стэнфордского университета. Он собрал «Unix-систему с микропроцессором 68000» из запчастей для проекта «Вычислительная сеть Стэнфордского Университета». В феврале 1982 Бехтольшейм и Хосла основали компанию Sun Microsystems.

Первые рабочие станции компании работали под управлением Version 7 Unix, портированной компанией UniSoft для работы на микропроцессорах 68000.

В 2002г. цена акций Sun упала до значения 1998г. В середине 2004г. компания прекратила производство на заводе в Ньюарке (Калифорния, США) и сконцентрировала всё производство в Хиллсборо (Орегон, США) в качестве дополнительных мер по сокращению издержек.

20 апреля 2009г. года было анонсировано соглашение о покупке Sun компанией Oracle, по цене $9,5 за акцию, общая сумма сделки составила $7,4 млрд. Сделка была завершена 27 января 2010г..

В первое десятилетие своей истории компания Sun была, в основном, поставщиком рабочих станций, успешно конкурируя на этом рынке с другими производителями в 1980-х годах. В последние годы компания выделялась комплексным подходом к вычислительным системам, включающим в комплексе серверы Sun Fire, операционные системы Solaris, системы хранения данных StorageTek, сервисы Sun Spectrum.

Page 61: Современные проблемы информатики и вычислительной техники

61 `

Платформа Java. Крупным вкладом Sun в развитие современных информационных технологий стало создание платформы Java в целом и таких продуктов, как сервер приложений с открытым исходным кодом GlassFish, в частности.

Компиляторы и инструменты разработки

JDK — бесплатный набор библиотек и простейших инструментов для разработки ПО на Java, в том числе — компилятор javac.

NetBeans IDE — бесплатная интегрированная среда разработки ПО для всех платформ Java. Пропагандируется Sun как базовое средство для разработки ПО на языке Java и других языках.

Sun Studio это среда разработки для языков программирования C, C++ и Фортран, включающая компиляторы, средства сборки, отладки и профилирования приложений. Sun Studio бесплатна и доступна для Solaris,OpenSolaris и для GNU/Linux. Начиная с версии 11 основана на NetBeans IDE.

Sun Java Wireless Toolkit — бесплатный набор средств для разработки программ для мобильных телефонов(платформа — Java ME, CLDC/MIDP).

6.16 Transmeta

Transmeta — в прошлом американская корпорация — создатель передовых микропроцессоров и держатель патентного портфолио по микропроцессорным технологиям.

Компания была основана в 1995г Чмеликом, Дитцелом, Хантером, Келли, Лэйердом, Уингом и Зайнером, с целью создания процессоров, основанных на технологиях VLIW программного кода.

Всего было создано 2 таких процессора: Crusoe и Efficeon. Низкое потребление энергии и малое выделение тепла позволяет использовать эти процессоры в ультра-портативных ноутбуках,блэйд-серверах, TabletPC, а также бесшумных настольных ПК.

В начале развития компании было непонятно, какие цели она преследует. Страничка в Интернете появилась в середине 1997г., но в течение последующих двух с половиной лет она не содержала ничего кроме строчки «эта страница пока отсутствует». Понемногу просачивающаяся информация обозначила направление усилий компании: VLIW-процессор, способный переводить инструкции x86 в собственный программный код. Поскольку запланированный Intel процессор под названием Merced (Itanium) также был основан на VLIW и трансляции кода х86, возникла масса домыслов и слухов о том, что новый чип Transmeta будет обладать производительностью суперкомпьютера, будучи при этом дешевле в производстве, чем процессоры Intel, AMD и Cyrix.

Пробный камень. Crusoe.

И в самом деле, в пресс-релизах Transmeta говорилось о революционном предложении для рынка экономичных устройств и о предстоящем лидерстве среди х86-совместимых процессоров. Однако первые же испытания новинки обнаружили значительное отставание в производительности. Новый микропроцессор был представлен публике под названием Crusoe в январе 2000г, но изготовление реальных микросхем началось позже. К сожалению, первые выпущенные процессоры страдали от технологических недоработок и задержек в производстве, что повлекло за собой финансовые потери, и серию перестановок в менеджементе компании.

Тем временем рынок не стоял на месте: Intel и AMD после успешного прибавления вычислительной мощности вплотную занялись вопросами потребляемой энергии, так что для выходящей новинки оставался сегмент экономичных и компактных устройств с невысокой производительностью и малыми объемами производства.

Фокус на производительности. Efficeon.

Transmeta отреагировала поспешным редизайном устройства и выпуском новой модели Efficeon (анонсирована в августе 2003г., выпуск осенью 2003г.). Она обладала вдвое более высокой производительностью. Тем не менее, даже она значительно отставала от конкурентов, при этом сложность чипа значительно возросла. Большие размеры и потребление энергии подрывало главное конкурентное преимущество Transmeta.

Page 62: Современные проблемы информатики и вычислительной техники

62 `

Линус Торвальдс и другие.

За время своего существования компания несколько раз заключала контракты с известными фигурами в IT, например, Линусом Торвальсом и Дейвом Тейлором. Цели сотрудничества не раскрывались, что подогревало догадки и теории, гулявшие в прессе, и в результате создало компании прекрасную возможность для запуска сенсаций.

Линус Торвальдс работал в корпорации с 1997г по 2003г.. Он покинул компанию в июне 2003г., чтобы сосредоточиться на продолжении развития ядра Linux.

Важнейшим багажом, которым обладает компания и по сей день, является ее патентное портфолио. Это дает почву для предположений, что ради него она может быть приобретена одним из более крупных игроков, таких как AMD или Microsoft.

Примером чрезмерного внимания средств массовой информации может служить редакционная статья в журнале Upside, назвавшая Transmeta самой важной компанией в Силиконовой долине. В то же время почти не известен факт, что компания никогда не была прибыльной, пока предпринимала попытки выпускать процессоры. В 2002г. ее убытки составили $114 млн., в 2003г.. — $88 млн., в 2004г. — $107 млн.

Переориентирование на патенты.

К январю 2005г. стало известно, что компания приняла решение о стратегическом переориентировании из производства процессоров в область исключительно патентного права. Таким образом, Transmeta сосредоточилась на продаже прав на технологии другим производителям микросхем. Февраль 2005г. ознаменовался резким всплеском слухов о предстоящей покупке Transmeta фирмой AMD. В марте 2005г..было объявлено о сокращении 68 сотрудников, и штат сократился до 208 человек. Примерно половина из них занимается внедрением технологии сбережения энергии LongRun2 в продукты компании Sony. Последняя является крупнейшим потребителем патентованных технологий Transmeta.

31 мая 2005г. г. было объявлено о приобретении активов Transmeta и лицензионных соглашениях со стороны гонконгской компании Culture.com Technology Limited (руководитель Чу-Бонг-Фу, один из влиятельных деятелей китайской компьютерной промышленности). Впрочем, в результате задержек необходимых экспортных разрешений Американской торговой палаты сделка была расторгнута 9 февраля 2006г.

11 октября 2006г. Transmeta объявила, что возбуждает иск против Intel Corporation по поводу нарушения десяти патентов, зарегистрированных в США. Иск, поданный в региональный суд штата Делавер, требует прекращения продаж изделий, нарушающих патент, и выплаты денежной компенсации. Intel по условиям соглашения должна выплачивать Transmeta $250 млн. в урегулирование патентного иска.

Осенью 2008г. года компания Transmeta была куплена американской компанией Novafora, занимавшейся проектированием видеопроцессоров. В августе 2009г. Novafora прекратила свою деятельность в результате банкротства.

6.17 TSMC

TSMC (Taiwan Semiconductor Manufacturing Company) — тайваньская компания, занимающаяся изучением и производством полупроводниковых изделий. Основана в 1987 правительством Китайской республики, компанией Philips и частными инвесторами.

Штаб-квартира TSMC находится в Синьчжу (Тайвань). В настоящее время в компании работает более 20 000 человек по всему миру. Чтобы обслуживать и поддерживать производственные мощности, TSMC содержит офисы в Китае, Индии, Японии, Ю. Корее, Нидерландах, США и на Тайване.

TSMC — крупнейший контрактный производитель полупроводниковых микросхем с долей рынка 48,8%, разработавший большое количество перспективных технологий, производственных процессов, средств проектирования и стандартных архитектур.

Сейчас TSMC обладает технологиями производства микросхем с нормами 130, 90, 65, 45, 40, 28, 20 нанометров.

Page 63: Современные проблемы информатики и вычислительной техники

63 `

Судебное противостояние Apple и Samsung стало одной из важнейших тем для обсуждения в сфере патентных споров в 2012г.. Обе компании, имея гигантские обороты, стремились получить друг от друга как можно больше выплат, из-за чего долгое время судились в разных концах света.

Таким образом, хотя Samsung по-прежнему является производственным партнёром Apple, в Apple уже не хотят иметь с корейским гигантом никаких связей.

Теперь в Apple ищет сотрудничества с TSMC в качестве производителя мобильных чипов для своих устройств. В СМИ неоднократно сообщалось, что Apple ведёт переговоры с тайваньской компанией, однако пока официальных подтверждений тому нет. Более того, сообщается, что Apple также вела переговоры и с Intel, предлагая компании существенный кусок от пирога мобильного рынка. Если эти слухи окажутся правдой, то у Apple появится прекрасный шанс отказаться от услуг столь ненавистной им Samsung и получить огромные технические преимущества, поскольку Intel является одной из передовых компаний в производстве чипов и она обладает такими технологиями, до которых TSMC будет развиваться ещё несколько лет.

Сообщается, что уже со 2 квартала 2013г. Apple начнёт производство процессоров для своих гаджетов на заводах TSMC по 28-нм техпроцессу, что является для «яблочной» компании шагом назад, поскольку Samsung изготавливает для них процессоры по 20-нм технологии. В сообщении также говорится, что от этого могут пострадать главные заказчики компании — Qualcomm и NVIDIA. Дело в том, что Apple предложила $1 млрд. за эксклюзивное право использования производственных мощностей TSMC, однако финансовый директор Taiwan Semiconductor Manufacturing Company заявил, что его фирма не продаётся, каким-бы то ни было способом, а значит, остальным заказчикам пока что волноваться рано.

6.18 Производители в России

6.18.1 Миландр

ЗАО «ПКК Миландр» — российская компания-разработчик и производитель микроэлектронной элементной базы, ориентированной на использование в изделиях с повышенными требованиями к надёжности (авиакосмическая техника, спецтехника и т. п.). Большинство изделий компании поставляются как с приёмкой «1» (приёмкой ОТК), так и с приёмкой «5» (приёмкой заказчика).

Миландр — первая российская компания, получившая лицензию на использование микропроцессорного ядра ARM в микроконтроллерах собственной разработки.

Компания ЗАО «ПКК Миландр» организована в 1993 в городе Зеленоград.

Основные виды деятельности компании

разработка и производство интегральных микросхем с проектными нормами от 1 мкм до 0,18 мкм;

тестирование, измерения и испытания микросхем, в том числе импортных;

разработка и производство электронных модулей,блоков и законченных изделий

дистрибьюция и комплексная поставка электронных компонентов отечественного и импортного производства для комплектации радиоэлектронной аппаратуры гражданского и специального назначения.

В 2008г «ПКК Миландр» приобрела лицензию на процессорное ядро ARM Cortex-M3. В настоящее время на базе данного ядра налажен выпуск серии микроконтроллеров 1986ВЕ9x, ориентированных на применение в специальной технике и системах с повышенной надёжностью с рабочим температурным диапазоном −60 °С…+125 °С.

В сентябре 2010г. дизайн-центр ЗАО «ПКК Миландр» заключил лицензионное соглашение с компанией ARM о приобретении исходного кода на языке Verilog для микропроцессорного ядра ARM Cortex-M0. Процессорное ядро ARM Cortex-M0 имеет самое низкое энергопотребление из всех доступных процессоров ARM, составляющее лишь 85 мкВт/МГц (0,085 мВт). На базе этого ядра компанией «ПКК Миландр» разработан российский микроконтроллер, предназначенный для систем учёта электроэнергии, энергосберегающих систем и систем с автономным электропитанием.

Page 64: Современные проблемы информатики и вычислительной техники

64 `

В 2012г. компанией была приобретена лицензия на микропроцессорное ядро ARM Cortex-M4F для дальнейшего использования в собственных разработках.

В 2012г. создан филиал предприятия в г. Екатеринбурге;

В 2012г. освоен промышленный выпуск электронных счетчиков «Милур-104»

6.18.2 МЦСТ

МЦСТ (закрытое акционерное общество (ЗАО) «МЦСТ») — российская компания, специализирующаяся на разработке универсальных микропроцессоров, микроконтроллеров и управляющих вычислительных комплексов. Имеет опыт разработки супер-ЭВМ «Эльбрус». Также в компании ведутся разработки оптимизирующих и двоичных компиляторов, операционных систем. ЗАО «МЦСТ» является базовой организацией кафедры информатики и вычислительной техники Московского физико-технического института (государственного университета).

Основная деятельность компании сосредоточена в следующих областях компьютерных технологий:

исследование и разработка архитектуры микропроцессоров;

проектирование микропроцессоров на глубоко-субмикронных нормах, микропроцессорных наборов, систем памяти, контроллеров, включая разработку производственной документации для фабрик-изготовителей;

проектирование компьютеров на базе микропроцессоров собственной разработки в различных классах (сервер, рабочая станция, персональный компьютер);

проектирование компьютерных модулей и логических устройств;

проектирование высокоэффективных оптимизирующих компиляторов;

проектирование двоичных компиляторов;

развитие возможностей операционных систем, в том числе операционных систем реального времени;

создание и сопровождение операционных систем с интерфейсом Unix (POSIX).

История.

Согласно информации с сайта компании, ЗАО «МЦСТ» является правопреемником ТОО «Московский центр SPARC-технологий (МЦСТ)», которое возникло в марте 1992г на базе коллектива, занимавшегося разработкой «Эльбрус-3» в Институте точной механики и вычислительной техники РАН им. С.А. Лебедева. По словам основателя и бывшего научного руководителя «Московского центра SPARC-технологий» Бориса Бабаяна, финансовую поддержку компании сначала оказывал Дитцел (один из основателей Transmeta).

Позднее при участии Бориса Бабаяна были созданы еще несколько компаний: «Эльбрус 2000», «Эльбрус Интернейшнл», которые вместе образовывали компанию «Эльбрус МЦCТ». «Эльбрус 2000» создавался, по утверждению Бориса Бабаяна, просто как дистрибьютор, который торгует техникой и зарабатывает деньги. В «Эльбрус Интернейшнл» были сконцентрированы патенты, в частности на процессор E2K. Компания «Эльбрус МЦCТ» работала как по заказам зарубежных компаний (Sun, Transmeta), так и выполняла работы по заказам Правительства России.

В 2004г. в прессе появились сообщения от компании Intel, что компания пригласила несколько групп разработчиков из «Эльбрус МСЦТ» на работу в Intel, в том числе Бориса Бабаяна.

ЗАО „МЦСТ“ продолжает и будет продолжать проведение работ, связанных с правительственными заказами. Эта задача является приоритетной в планах компании.

Разработки

Вычислительные комплексы:

SPARC: Эльбрус-90микро (доступен в нескольких исполнениях)

ELBRUS: Эльбрус-3М1

Микропроцессоры VLIW/EPIC архитектуры ELBRUS (Е2К):

Page 65: Современные проблемы информатики и вычислительной техники

65 `

Эльбрус E2K (1891ВМ4Я, техпроцесс 0,13 мкм, 300 МГц, 50 млн транзисторов, до 23 инструкций за такт) 2007г.

Эльбрус-S (1891ВМ5Я, техпроцесс 90 нм, 500 МГц, 90 млн транзисторов, 190 мм²) 2010г.

Микропроцессоры архитектуры SPARC:

МЦСТ-R100 (техпроцесс 0,5 мкм, 100 МГц)

МЦСТ-R150 (1891ВМ1, техпроцесс 0,35 мкм, 150 МГц, 2.8 млн. транзисторов, 100 мм²) 2001г.

МЦСТ-R500 (1891ВМ2, техпроцесс 0,13 мкм, 500 МГц, 4.9 млн. транзисторов, 25 мм²) 2004г.

МЦСТ-R500S (1891ВМ3, техпроцесс 0,13 мкм, 2 ядра, 500 МГц, 45 млн. транзисторов, 81 мм²) 2007г.

Прошли государственные испытания и рекомендованы к серийному производству:

МЦСТ-R1000 (1891ВМ6Я, техпроцесс 90 нм, 4 ядра, 1 ГГц, 180 млн транзисторов, 128 мм²) Для использования в мобильных устройствах, встраиваемых системах и высокопроизводительных вычислительных комплексах.

Эльбрус-2С+ (1891ВМ7Я, техпроцесс 90 нм, 2 ядра + 4 DSP, 500 МГц, 368 млн транзисторов, 289 мм²) Для использования в системах цифровой обработки сигнала, такие как радары, анализаторы изображений и т.п.

6.18.3 НИИМЭ и Микрон

ОАО «НИИМЭ и Микрон» — российская компания, один из крупнейших производителей интегральных схем в Восточной Европе.

Основана 9 марта 1964г как НИИ молекулярной электроники (НИИМЭ), при котором 1 февраля 1967г был создан завод «Микрон». Завод «Микрон» (вместе с зеленоградским заводом «Ангстрем» и минским объединением «Интеграл») являлся основным производителем интегральных схем в СССР.

В 1994г НИИМЭ и завод «Микрон» были акционированы как единая компания, которая в 1997г вошла в состав концерна «Научный Центр» (ныне концерн «Ситроникс»).

В июле 2006г. года концерн «Ситроникс» подписал соглашение с франко-итальянской компанией STM о передаче технологий производства микросхем с топологическим размером 180 нм Производство налажено в одном из цехов завода «Микрон». Заявленная проектная мощность предприятия — 18 тыс. 200-мм пластин в год. . Инвестиции концерна в проект составили $200 млн.

12 декабря 2007г. года предприятием было объявлено о начале производства микросхем с топологическим размером 180-нм. Чипы, изготовленные на «Микроне», планировалось применять в транспортных картах (в том числе в Московском метрополитене), паспортах, платёжных картах, SIM-картах, RFID-метках и др.

В 2009г. совместно с ГК РОСНАНО начат проект по созданию производства СБИС с проектными нормами 90-нм на пластинах диаметром 200 мм. Технология производства будет передана компанией STM. Сроки начала производства микросхем 2011г. Запланированная мощность производства — 3000 пластин в месяц.

В начале 2011г. американское издание Fast Company, специализирующееся на теме инноваций, составило рейтинг ведущих инновационных компаний России. В этом рейтинге компания «НИИМЭ и Микрон» заняла 8-е место.

В феврале 2012г. на предприятии состоялся физический пуск производства на 90-нм линии.

Page 66: Современные проблемы информатики и вычислительной техники

66 `

7 Суперкомпьютеры XXI века

Рост производительности компьютеров пока подчиняется феноменологическому закону Г.Мура, который гласит, что производительность компьютеров увеличивается в два раза каждые 18 месяцев. В ХХ веке этот закон был применим и к быстродействию (тактовой частоте) микропроцессоров. Сегодня возможности увеличения тактовой частоты исчерпаны, но рост производительности продолжается за счет увеличения числа процессоров в суперкомпьютерах и серверах, а также построения многоядерных персональных компьютеров. При этом справедливость закона Мура сохраняется в отношении степени интеграции СБИС.

В таблице приведены сведения о лидерах мирового списка Top500 наиболее производительных компьютеров мира. Этот список публикуется два раза в год, официальная страница Top500 находится по адресу http://www.top500.org/. Данные подтверждают рост производительности по показательному закону. В ноябрьских списках 2004-2007 годов первое место занимал суперкомпьютер BlueGene/L, включающий более 16 тысяч процессорных модулей, каждый из которых состоит из четырех двухпроцессорных СБИС.

Год Компьютер Максимальная производительность, Tflop/s Число процессоров

1999 Intel ASCI Red 2,4 9632

2000 IBM ASCI White 4,9 8192

2001 IBM ASCI White 7,3 8192

2002 NEC Earth Simulator 35,9 5120

2003 NEC Earth Simulator 35,9 5120

2004 IBM BlueGene/L 70,7 32760

2005 IBM BlueGene/L 136,8 65536

2006 IBM BlueGene/L 281 131000

Page 67: Современные проблемы информатики и вычислительной техники

67 `

2007 IBM BlueGene/L 478.2 212992

2008 IBM Roadrunner 1025 122400

2009 Cray XT5-HE 1756 224162

2010 Tianhe-1A 2570 186368

2011 SPARC64 VIIIfx 2.0GHz 8162 548352

Лидер июньского 2008 г. списка — суперкомпьютер IBM Roadrunner BladeCenter QS22/LS21 Cluster, построенный на процессорах Opteron 1.8 ГГц и PowerXCell 3.2 ГГц с межстоечными связями на основе Infiniband. Компьютер занимает приблизительно 12,000 1100 м2 и весит 226 тонн. Энергопотребление — 3,9 MВт. Цена 133 млн долларов.

Лидер списка TOP500 июня 2010 г. - суперкомпьютер Jaguar - Cray XT5-HE, построенный на 224 тысячах процессоров Opteron с тактовой частотой 2.6 ГГц, имеет производительность 1,76 Pflops.

Самый мощный компьютер, имевшийся в России к ноябрю 2007 г., Cluster Hewlett-Packard BL460c на 3760 микропроцессорах Xeon, производительность 33,8 Tflop/s, занимал 33 место в списке Top500. Установлен в Объединенном суперкомпьютерном центре. В июне 2008 г. он был отодвинут на 56-е место.

Лучший в России компьютер на 2008 г. — СКИФ Т60, установленный в МГУ, занимал в списке Top500 36-е место с производительностью 47 Tflop/s.

Его характеристики:

Пиковая производительность 60 TFlop/s

Производительность на Linpack 47.04 TFlop/s (78.4% от пиковой)

Число процессоров/ядер в системе 1250 / 5000

Модель процессора Intel Xeon E5472 3.0 ГГц

Объём оперативной памяти 5.5 Тбайт

Дисковая память узлов 60 Тбайт

Число стоек всего/вычислительных 42 / 14

Число блэйд-шасси/вычислительных узлов 63 / 625,

Все узлы в СКИФ Т60 связаны тремя независимыми сетями:

Системная сеть: InfiniBand DDR (Mellanox ConnectX), (Fat Tree: 6x144 порта; латентность на уровне MPI: 1.3-1.95 мкс; скорость обмена на уровне MPI: 1540 Мбайт/с);

Page 68: Современные проблемы информатики и вычислительной техники

68 `

Вспомогательная сеть: Gigabit Ethernet (2x(336 портов+4x10G) + 2x(48 портов+4x10G) + 24x10G);

Управляющая сеть: СКИФ-ServNet+IPMI.

Другие характеристики:

Общая занимаемая площадь 96 м2;

Общий вес 30 т ;

Номинальное энергопотребление компьютера 330 кВт;

Общее энергопотребление комплекса 720 кВт.

К июню 2010 г. лидером среди отечественных суперкомпьютеров стал "Ломоносов", установленный в вычислительном центре МГУ. Он занимает 13 место в Top500. Его производительность 0,35 Pflops.

Помимо суперкомпьютинга, рост вычислительных мощностей для реализации сложных ресурсоемких приложений обеспечивается в GRID-технологиях. Это технологии распределенных вычислений, основанные на рациональной загрузке ресурсов и/или совместном использовании распределенных ресурсов вычислительных сетей.

GRID-технологии можно трактовать как способы создания сверхмощных виртуальных суперкомпьютеров, которые могут превосходить реальные суперкомпьютеры по показателям производительности, масштабируемости, доступности при существенно меньших затратах средств. Создание GRID-систем подразумевает прежде всего стандартизацию в области учета и доступа к ресурсам, обеспечения требуемого качества и безопасности обслуживания.

7.1 Суперкомпьютеры списка TOP500

В 2010 г. за полгода (с июня по ноябрь) в списке Top500 добавилось 195 новых суперкомпьютеров. Лидером в мире суперкомпьютеров в ноябре 2010 г. стал китайский компьютер Tianhe-1A производительностью 2.57 petaflop/s. На 2 месте - лидер предыдущего списка Top500 Cray XT5 “Jaguar” (США) с 1.75 petaflop/s. 3 место занимает опять же китайский суперкомпьютер Nebulae (1.27 petaflop/s). В первой десятке (Top10) находятся 5 американских, 2 китайских и по 1 компьютеру из Японии, Франции и Германии, причем японский суперкомпьютер Tsubame 2.0 занимает 4 место. Из 500 компьютеров 274 находится в США, 124 в Европе, 84 - в Азии (в Китае 41, в Японии 26), 11 - в России. В список не вошли компьютеры с производительностью менее 31.1 teraflop/s. На 17-м месте - российский суперкомпьютер Ломоносов производительностью 350 teraflop/s на процессорах Intel EM64T Xeon X55xx (Nehalem-EP) 2930 MHz (11.72 GFlops), с памятью 54 Тбайт.

Среди вендоров лидером является IBM - 200 суперкомпьютеров, далее следуют Hewlett-Packard - 159 и Cray Inc. - 29 систем. В России система Ломоносов создана в компании T-Platforms.

Page 69: Современные проблемы информатики и вычислительной техники

69 `

Преобладают системы с кластерной архитектурой (83%) и с архитектурой MPP (16%). В качестве коммутирующей среды (Interconnect Family) используются Gigabit Ethernet (45,6% систем) и Infiniband (42,6%). Операционная система или Linux (91,8%), или Windows (5%).

79.6% систем выполнены на процессорах Intel (преобладают процессоры Xeon E55xx (Nehalem-EP), Xeon E54xx (Harpertown) и Xeon X56xx (Westmere-EP)), 11.4% - AMD Opteron, 8% - IBM Power. Процессоры с шестью и более ядрами имеются в 95 суперкомпьютерах, большинство построено на 2-ядерных СБИС. В китайских и японском суперкомпьюерах для увеличения производительности использованы графические процессоры NVIDIA. Число процессоров в Tianhe-1A равно 186368, в Ломоносов - 35360, большинство систем имеют число процессоров в диапазоне от 4 до 8 тысяч.

Средняя потребляемая мощность по Top500 - 447 квт (195 Mflops/W), а по Top10 - 3.2 Mвт.

В июне 2011 г. список Top500 возглавил японский суперкомпьютер SPARC64 компании Fujitsu с производительностью 8,16 Рflops. Российский суперкомпьютер Ломоносов повысил быстродействие до 674 Tflops и поднялся на 13 место.

Для сравнения и иллюстрации прогресса в области суперкомпьютеров приведем данные по Top500 трехлетней давности. В список Top500 (ноябрь 2007 г.) были включены суперкомпьютеры с производительностью, не менее 5.9 TFlop/s. Общая производительность всех 500 компьютеров составляла 6.97 PFlop/s. 100-й номер в списке имел 9.29 TFlop/s. Семь позиций в списке занимали компьютеры, установленные в России, наиболее производительный среди них имел 33 Tflop/s и находился на 33 месте.

70.8% систем были построены на процессорах Intel, 15.6% — на AMD Opteron, 12.2% — на IBM Power. Наблюдалась тенденция к увеличению доли Intel.. В основном использовались 2-ядерные процессоры.

Кластерами являлись 406 систем из 500. Внутренняя коммутация реализована на Gigabit Ethernet в 270 системах, Infiniband — в 121 системе.

В качестве примера рассмотрим конструкцию лидера списка Top500 от ноября 2007 г. суперкомпьютера Blue Gene/L

Базовым компонентом суперкомпьютера Blue Gene/L является так называемая "вычислительная карта" (compute card), которая состоит из 2 вычислительных узлов, где каждый узел содержит 2 процессора PowerPC 440. 16 вычислительных карт группируются в модульную (или узловую) карту, которая, таким образом, содержит уже 64 процессора. В свою очередь, 16 модульных карт устанавливаются на объединительной панели (midplane), и 2 таких панели монтируются в серверную стойку (cabinet), которая содержит в итоге 1024 узла с общим количеством процессоров 2048.

Процессор PowerPC 440 способен выполнять за такт 4 операции с ПТ, что для заданной частоты соответствует пиковой производительности в 1,4 TFlop/s на одну объединительную панель (midplane), если считать, что на каждом узле установлено по 1 процессору. Второй процессор на узле, идентичный первому, призван выполнять телекоммуникационные функции, то есть, он предназначен, преимущественно, для осуществления связи с другими процессорами суперкомпьютера. Кроме того, конструкцией суперкомпьютера, предусмотрена установка некоторого количества 2-процессорных узлов, которые занимаются исключительно операциями ввода/вывода.

Узлы суперкомпьютера связаны между собой 5 сетями:

трехмерной тороидальной сетью для обмена данными непосредственно между блоками-узлами,

сетью с топологией "дерева" для выполнения общих (глобальных) для всех блоков операций,

сетью барьеров и прерываний,

сетью Gigabit Ethernet-JTAG (Ethernet со специальным интерфейсом JTAG),

еще одной сетью Gigabit Ethernet для подключения к главному (хост-) компьютеру, файловым серверам и другим системам.

Энергопотребление суперкомпьютера Blue Gene/L составляет порядка 1,6 мегаватт.

Page 70: Современные проблемы информатики и вычислительной техники

70 `

7.2 Тенденции в развитии вычислительных систем

Судя по списку Top500 2007 года, наметились следующие тенденции в суперкомпьютинге и развитии вычислительных систем.

Постепенный переход от специализированных процессоров к универсальным многоядерным вариантам. Суперкомпьютеры строятся на узлах, включающих от 4 до 16 ядер.

Преимущественное исполнение суперкомпьютеров — кластерные архитектуры, занимающие больше половины позиций в Top500 июня 2007 г..

Появляются кластеры кластеров, образующие grid архитектуры.

В качестве ОС применяются в основном Linux и Windows.

Производительность суперкомпьютеров перешагнула петафлопсный рубеж. Так, в июне 2011 г. лидер мирового списка самых производительных компьютеров мира SPARC64 компании Fujitsu (Япония) имеет производительность 8,16 petaflops. (один petaflops = 1015 операций с ПТ в секунду).

7.3 Интернет-2

Internet-2 представляет собой проект закрытой и некоммерческой сети, предназначенной для обслуживания исследовательских организаций в научных целях и развиваемый в США при поддержке ведущих университетов и телекоммуникационных компаний.

Ядром всех информационных сетей являются ее каналы передачи данных (Backbone Networks). В качестве основной транспортной магистрали Internet-2 использует оптоволоконную сеть Abilene, которая была развернута в США в течение 1998-2003. Предусмотрена трансконтинентальная связь. Первоначальная скорость 2,5 Гб/с, увеличена до 10 Гбит/с.

Сеть основана на протоколах IPv6 и технологиях ATM и SONET (Synchronous Optical Network). Точками доступа к магистральным каналам являются специализированные устройства "gigaPoP" (gigabit capacity point of presence). Одна из особенностей Интернет-2 — имеются два типа точек доступа: первый тип обеспечивает доступ к высокоскоростному закрытому Интернет-2, второй тип позволяет подключать коммерческие организации, но без пересылки их трафика по высокоскоростным каналам, а только для доступа к информации в Интернет-2. Другими словами, пользователи других сетей, подключенных к Интернет-2, смогут получать его информацию, а вот использовать каналы для транзита своей информации им будет запрещено.

Все протоколы стека TCP/IP реализованы, включая протоколы поддержки мультикастинга IGMP и поддержки резервирования ресурсов RSVP.

Page 71: Современные проблемы информатики и вычислительной техники

71 `

Примеры применения Интернет-2: проведение совместных ресурсоемких вычислений, и исследований; дистанционный доступ к уникальному оборудованию и дистанционное управление объемными моделями из разных центров; совместное 3D моделирование; видеоконференции; использование мультимедийных библиотек в учебном процессе и др.

7.4 Мультиплексирование по длинам волн (WDM)

В традиционной технологии передачи данных по волоконно-оптическим линиям связи используется метод временного разделения каналов (TDM), передача данных всех каналов производится в одной и той же полосе пропускания внутри одной жилы (световода) ВОЛС. При этом реально достижимая пропускная способность обычно не превышает 2,5 Гбит/с.

Существенное повышение скорости передачи данных достигается в технологии мультиплексирования по длинам волн WDM (Wavelength Division Multiplexing), в которой одновременно в одной жиле передаются данные по нескольким частотным каналам в инфракрасном диапазоне, т.е. наряду с TDM используется метод частотного разделения каналов FDM.

С помощью WDM можно в одном световоде достичь пропускной способности до 80 Гбит/с. Общая информационная скорость, достигнутая к 2009 г, составляет15,5 Тбит/c.

Суть WDM состоит в том, что несколько информационных цифровых потоков, переносимых каждый на своей оптической несущей, разнесенных в пространстве, с помощью специальных устройств (оптических мультиплексоров - ОМ), объединяются в один оптический поток, который вводится в оптическое волокно. На приемной стороне производится обратная операция демультиплексирования.

К мультиплексорам WDM можно подключать различные устройства из сетей других типов, например, терминалы синхронной цифровой иерархии и синхронной волоконно-оптической сети (SONET), коммутаторы сетей ATM, маршрутизаторы, функционирующие в IP-сетях.

Один частотный канал занимает полосу 50 или 100 ГГц в диапазоне длин волн 1310, 1400, 1550 или 1580 нм. Различают следующие разновидности WDM:

* CWDM (Coarse WDM) — мультиплексирование с частотным разносом каналов не менее 200 ГГц, позволяющие мультиплексировать 16 каналов;

* DWDM (Dense WDM) — мультиплексирование с разносом каналов не менее 100 ГГц, позволяющие мультиплексировать до 40 каналов.

* HDWDM (High Dense WDM) — мультиплексирование с разносом каналов 50 ГГц и менее, позволяющие мультиплексировать не менее 64 каналов.

Схему работы WDM системы можно выразить следующим образом. На вход мультиплексора поступают сигналы из многих потоков со скоростью 6,3 Гбит/с в каждом, на выходе формируется поток данных 100-Гбит/с. Таких потоков может быть несколько. Например, в случае объединения по методу FDM четырех 100-Мбит/с потоков формируется оптический сигнал, передающий 400 Гбит/с. Все сигналы усиливаются широкополосным волоконно-оптическим усилителем и транспортируются по оптоволоконной линии длиной в несколько десятков или сотен км. На противоположной стороне происходят обратные преобразования сигнала.

Пример WDM сети - оптическая транспортная система DWDM Unitrans ZXWM-32. Скорости передачи данных от 10 до 400 Гбит/с на расстояния до 640 километров без применения электрических регенераторов.

Рекордные скорости передачи данных достигаются в Internet-2. В ходе эксперимента 2006 г. данные по ВОЛС передавались из Токио через Сиэтл, Амстердам и Чикаго обратно в точку отправления и была получена скорость 8,8 Гбит/с. Если же применять технологии WDM, например, с 10 несущими, то можно достичь 80 Гбит/с.

7.5 Технологии Grid

Появлению технологии Grid предшествовала идея метакомпьютинга, т.е. объединения вычислительных и коммуникационных технологий. Метакомпьютинг определяется как использование мощных

Page 72: Современные проблемы информатики и вычислительной техники

72 `

вычислительных ресурсов, прозрачно доступных посредством коммуникационной среды, как объединение множества компьютеров в единый вычислительный ресурс. Под ресурсами подразумеваются не только собственно компьютеры, но и коммуникационные средства, системы хранения и программные фонды.

Примером программного обеспечения для Grid систем являются продукты, разработанные в проекте Globus. В него входят следующие службы и протоколы:

протокол GRAM (Grid Resource Allocation and Management) доступа к управлению ресурсами и служба Gatekeeper, которые обеспечивают безопасное создание удаленных процессов и управление ими;

служба метакаталогов GIS (Grid Information Service), отвечающая за распределенный сбор данных и информационное обслуживание;

службы GSI (Grid Security Infrastructure) инфраструктуры безопасности, поддерживающие однократную регистрацию, делегирование полномочий и отображение прав доступа на разные локальные системы.

Программное обеспечение Grid делится на 4 слоя (уровня): адаптация ресурсов; связь; доступ к ресурсам; кооперация.

Слой адаптации (или базовый уровень) представляют службы, непосредственно работающие с ресурсами, к которым предоставляется разделяемый доступ. На слое выполняется унификация ресурсов — представление в виде абстрактных типов со стандартизованным множеством операций. Добавляются средства локального управления ресурсами, например, для вычислительных ресурсов это системы управления пакетной обработкой.

Слой связи (связывающий уровень) объединяет протоколы коммуникации и безопасности с образованием унифицированной базы сетевых транзакций для вышележащих слоев. Здесь решаются задачи аутентификации, защиты сообщений и авторизации. Коммуникации должны обеспечивать транспорт и маршрутизацию сообщений, присвоение имен объектам сети.

Слой доступа к ресурсам (ресурсный уровень) включает ряд протоколов и программных интерфейсов для удаленного использования ресурсов Grid. С помощью средств этого слоя производится поиск ресурсов, дистанционная инициация, мониторинг и управление операциями. В слое реализованы два типа протоколов: информационные и управляющие. Службы первого из них — GRIP (Grid Resource Information Protocol) — устанавливаются на каждом ресурсе и собирают данные о его характеристиках (конфигурация, платформа) и состоянии (текущая загрузка).

Информационная модель GRIP расширяема и позволяет, в принципе, представлять произвольные данные. Распределенная модель поддерживается вторым протоколом регистрации ресурсов GRRP (Grid Resource Registration Protocol), посредством которого сведения о наличии и местоположении GRIP сообщаются серверу GIIS (Grid Index Information Server), на который впоследствии подкачиваются данные со всех зарегистрированных серверов GRIP.

Page 73: Современные проблемы информатики и вычислительной техники

73 `

Слой кооперации (прикладной уровень) отвечает за интеграцию различных наборов ресурсов, службы слоя строятся над слоем удаленного доступа, позволяя взаимодействовать не с индивидуальным ресурсом, а с их совокупностью. На этом уровне имеются следующие службы:

каталогов; поскольку GIIS содержит информацию о всех ресурсах Grid, для поиска ресурсов с нужными свойствами достаточно направить запрос в одну точку, а не опрашивать каждый ресурс по отдельности. Способ наполнения сервера GIIS состоит в периодическом обновлении информации путем опроса зарегистрированных по протоколу GRIP служб ресурсов.

брокеров — агентов, посредничающих между заданием и ресурсами, обеспечивающих поиск свободных ресурсов и доступ к ним, выполняющих запуск заданий, проверку статуса, доставку выходных данных;

мониторинга и диагностики; функционирование Grid опирается на разнообразные данные о состоянии компонентов, которые затем используются в различных задачах: обнаружения сбоев, анализа производительности, распределения загрузки и т.п. Статусные данные мониторинга имеют ограниченное и, как правило, короткое время жизни, после чего они становится недостоверными. Поэтому частота их обновлений должна быть высокой, в то время как обычные базы данных ориентированы на выполнение запросов, а не на обновления.

репликации; отвечает за порождение реплик, отслеживает их размещение (с помощью каталога реплик) и предоставляет "лучшую" из них конкретному пользователю, которому известно только имя файла.

авторизации;

учета и платежей;

координации; задача слоя — распределять ресурсы не только по пространству, но и по времени. Программное обеспечение этого слоя состоит из служб планирования, которые собирают ресурсные запросы пользователей, поддерживают очереди запросов, определяют порядок (расписание) их удовлетворения и выполняют соответствующие задания.

7.6 Архитектуры Grid

Различают системы Grid одно- и двухуровневой архитектуры.

Одноуровневая архитектура Grid – аналог кластерной архитектуры, но с пространственно распределенными и принадлежащими разным владельцам узлами. В одноуровневой Grid системе ресурсы – пространственно распределенные компьютеры (узлы) – интегрируются через управляющий центр (грид-сервер), который является точкой доступа ко всем ресурсам и выполняет функции менеджера ресурсов (МР). В каждом узле устанавливается агент, выполняющий функции запуска заданий на компьютере, мониторинга заданий и ресурсов, защиты и контактов с управляющим центром. Доступ к ресурсам в одноуровневой архитектуре возможен только через интерфейсы грид-сервера, который для каждого поступающего на него запроса находит ресурсы на обрабатывающих узлах и инициирует обработку запроса.

В двухуровневой системе ресурсы отдельного узла находятся в автономном административном домене, связаны локальной сетью и обычно управляются системой пакетной обработки, которая играет роль локального МР. Узел включается в грид через одну одну или несколько машин-шлюзов, на которые устанавливаются грид-службы, и, таким образом ресурсы узла становятся доступны повсеместно.

Функционирование Grid обеспечивается специальными службами. В качестве служб для Grid в настоящее время используют Web-службы (SOAP, WSDL, WS-Inspection и т.д.).

Архитектура Grid определена в спецификациях OGSA (Open Grid Services Architecture). В OGSA задаются основные функции служб — обнаружение; динамическое создание ресурсов, управление ими, авторизация, управление параллельным выполнением и др.

7.7 Спецификации WSRF

Документ WSRF (Web Service-Resource Framework) состоит из набора спецификаций для выражения связи между ресурсами и Web-сервисами в GRID-технологиях и рассматривается как альтернатива спецификаций OGSA. В спецификациях WSRF определяются:

Page 74: Современные проблемы информатики и вычислительной техники

74 `

конкретные форматы сообщений,

способы управления жизненным циклом ресурса и специфицируются Web-сервисы для ликвидации ресурса;

способы запрашивания и модификации ресурсов,

способы представления и управления коллекциями Web-сервисов и/или WS-ресурсами

базовый XML-тип, используемый при обмене сообщениями в Web-сервисах для информирования о сбоях.

Включены также спецификации, относящиеся к интерфейсам Web-сервисов:

асинхронное оповещение, включая интерфейсы производителя и потребителя ;

организация и категоризация тем для подписки.

Page 75: Современные проблемы информатики и вычислительной техники

75 `

8 Современные универсальные процессоры

8.1 Процессоры Intel

8.1.1 Intel Core i3, i5, i7

Все процессоры серий Intel Core "i" изготовлены по новейшей технологии на основе микроархитектуры Nehalem. С 2012г. появятся версии с микроархитектурой Sandy Bridge,

Core i3 позиционируются как процессоры начального и среднего уровня цены и производительности. По уровню производительности стоят на самой низкой ступени, перед более дорогими и производительными Core i5.

Core i5 позиционируется как семейство МП среднего уровня цены и производительности, между более дешёвым Intel Core i3 и более дорогим Core i7. Они имеют встроенный контроллер памяти и поддерживают технологию Turbo Boost (автоматический разгон процессора под нагрузкой). Многие имеют встроенный графический процессор GPU. Как и другие процессоры для разъема LGA 1156, Core i5 соединяются с чипсетом через шину DMI.

Core i7 – высшее в Intel Core i. Это первое семейство, использующее микроархитектуру Intel Nehalem. В Core i7 дополнительно используются:

Технология Intel® QuickPath Interconnect. Разработана для повышения пропускной способности и снижения времени задержки. Она позволяет достигнуть скоростей передачи данных до 25,6 ГБ/с с процессорами Extreme Edition.

Встроенный контроллер памяти. Поддерживает три канала памяти DDR3 1066 МГц, благодаря чему пропускная способность памяти достигает 25,6 ГБ/с. Низкое время задержки и высокая пропускная способность контроллера памяти обеспечивают потрясающую производительность приложений, оперирующих большими объемами данных.

Технология Intel® HD Boost. Значительно повышает производительность разнообразных мультимедийных и ресурсоемких приложений. 128-разрядные команды SSE запускаются по одной за тактовый цикл, позволяя достичь нового уровня эффективности с приложениями, оптимизированными для набора команд SSE4.

Core i7 Extreme - новое решение для любителей активной многозадачной работы. Он ускорит работу всех приложений, которые вы запускаете на вашем компьютере, от компьютерных игр до приложений для создания и редактирования цифрового видео, музыки и фотографий. Благодаря высокой производительности системных плат на базе набора микросхем Intel® X58 Express и быстрым интеллектуальным многоядерным технологиям, которые динамически увеличивают производительность для обработки практически любых рабочих нагрузок, новые процессоры Intel® Core™ i7-980X Extreme Edition обеспечивают невероятный прорыв в области производительности ПК и поддержку различных функциональных возможностей.

В настоящее время выпускаются семейства МП серий “i”, они имеют кодовые названия.

Clarkdale для настольных систем, 32-нм, серии i3, i5.

Параметр Значения

Год 2010

Частота CPU, ГГц 2.93 - 3.33

Транзисторов в CPU, млн

382

Частота GPU, МГц 733

Транзисторов в GPU, млн

177

Ядра 2 (ЦПУ + видеоядро)

Кэш L2, КБ 2 х 256

Кэш L3, МБ 4

Шина DMI (Desktop Management Interface)

Page 76: Современные проблемы информатики и вычислительной техники

76 `

Память, МБ 2 х DDR3-1333

Напряжение, В 0.65 – 1.4

TDP, Вт 73

Разъем LGA 1156

Цена, $ 113 - 138

Arrandale для мобильных систем, 32-нм. Серии i3, i5, i7.

Параметр Значения

Год 2010

Частота CPU, ГГц 1.33 - 2.8

Транзисторов в CPU 382 млн.

Частота GPU, МГц 500 - 667

Транзисторов в GPU 177 млн.

Ядра 2 (ЦПУ + видеоядро)

Кэш L2, КБ 2 х 256

Кэш L3, МБ 3

Шина DMI (Desktop Management Interface)

Память, МБ 2 х DDR3-1066

Напряжение, В 0.725 – 1.4

TDP, Вт 18 - 358

Разъем LGA 1156

Цена, $ 241 - 305

Lynnfield для настольных систем, 45-нм. Серии i5, i7.

Параметр Значения

Год 2009

Частота CPU, ГГц 2.667 – 3.333

Транзисторов в CPU, млн

774

Ядра (потоки) 4 (4)

Кэш L2, КБ 4 х 256

Кэш L3, МБ 8

Шина, ГТ/c DMI (Desktop Management Interface), 2.5

Память, МБ 2 х DDR3-1333

Напряжение, В 0.65 – 1.4

TDP, Вт 95

Разъем LGA 1156

Цена, $ 196 - 205

Bloomfield для настольных систем, 45-нм. Серии i7, i7 Extreme.

Параметр Значения

Год 2008.

Частота CPU, ГГц 2.667 – 3.333

Транзисторов в CPU, млн

731

Ядра (потоки) 4 (8)

Кэш L2, КБ 4 х 256

Кэш L3, МБ 8

Шина, ГТ/c DMI (Desktop Management Interface), 2.5

Память, МБ 2 х DDR3-1066

Напряжение, В 0.8– 1.375

TDP, Вт 130

Page 77: Современные проблемы информатики и вычислительной техники

77 `

Разъем LGA 1366

Цена, $ 284- 999

Gulftown для настольных систем, 32-нм. Серии i7, i7 Extreme.

Параметр Значения

Год 2010г.

Частота CPU, ГГц 3.2 – 3.333

Транзисторов в CPU, млн

1170

Ядра (потоки) 6(12)

Кэш L2, КБ 6 х 256

Кэш L3, МБ 8

Шина, ГТ/c QPI (QuickPath Interconnect), 4.8

Память, МБ 3 х DDR3-1066

Напряжение, В 0.8– 1.375

TDP, Вт 130

Разъем LGA 1366

Цена, $ 985 - 999

В какчестве примера рассмотрим структуру Clarkdale.

Ядро имеет двухкристальную компоновку. Меньший по размеру (CPU Die – один кристалл). выполнен с использованием 32-нм технологии и несёт на себе 2 процессорных ядра, кэши 2 уровня для каждого ядра объемом 256 КБ, общий для ядер кэш 3 уровня объемом 4 МБ и контроллер шины QPI (QuickPath Interconnect Controller). Все остальные контроллеры расположены на втором кристалле (GPU Die – один кристалл), сделанном по 45 нм техпроцессу. Там имеются:

Ядро графического процессора GPU.

Двухканальный контроллер памти DDR3.

Page 78: Современные проблемы информатики и вычислительной техники

78 `

Контроллер управления интерфейсом DMI (Desktop Management Interface).

Контроллер интерфейса с дисплеем.

8.1.2 Intel Atom

Процессоры Intel® Atom™ могут использоваться в самых разнообразных устройствах, в том числе в смартфонах, КПК, планшетных ПК, нетбуках, настольных ПК начального уровня и других устройствах, идеально дополняющих ваш основной ПК. Процессоры этого семейства используются практически во всех нетбуках в 2010г. Процессоры Intel® Atom™ изначально разработаны для создания разнообразных инновационных устройств с низким энергопотреблением, от мобильных интернет-устройств до нетбуков, настольных ПК начального уровня и т.д.

Кроме того, эти процессоры, созданные на основе 45-нм технологии Intel® с диэлектриками Hi-k, позволяют разрабатывать более энергоэффективные системы. В процессоры Intel Atom также интегрированы графическая система, видеоконтроллер и контроллер памяти.

Для платформы настольных компьютеров начального уровня в начале 2010г. компания Intel выпустила второе поколение энергоэкономичных процессоров линейки Intel Atom. Главная особенность новых моделей, созданных на основе ядра Pineview, - объединение в едином корпусе процессора вычислительных ядер и встроенных контроллеров оперативной памяти и графических средств.

Intel Atom — семейство с низким потреблением энергии. Процессоры семейства поддерживают систему команд x86. Ранее были известны под кодовыми именами Silverthorne и Diamondville, были рассчитаны на изготовление при помощи 45-нм технологии КМОП и предназначены для применения в ультрамобильных компьютерах, коммуникаторах и других портативных устройствах, для которых важна малая потребляемая мощность.

Для этих процессоров был разработан специальный чипсет SCH, состоящий из одной микросхемы и вобравший в себя функции как «северного», так и «южного моста».

Intel Atom является CISC-процессором с архитектурой x86. Существует мнение, что CISC-архитектура меньше подходит для реализации процессоров мобильных устройств, нежели RISC (например,

Page 79: Современные проблемы информатики и вычислительной техники

79 `

процессоры ARM, основанные на архитектуре RISC, широко применяются в современных мобильных устройствах).

Новые процессорные технологии Intel и новые встраиваемые решения международного холдинга Kontron, связанные с реализацией глобальной программы освоения платформы Intel Atom, позволяют в условиях ограниченных бюджетов быстро и с минимальными рисками создавать весьма привлекательные конечные продукты, экономящие деньги разработчиков, и пользователей на всём протяжении жизненного цикла.

Вообще говоря, разработчикам и пользователям всегда интересны не столько сами процессоры, сколько комбинации «процессор + чипсет». Функциональность конечных изделий во многом определяется именно такими комбинациями. В случае Intel Atom это особенно верно, поскольку с «голыми» процессорами и «голыми» чипсетами производители плат на базе Intel Atom не работают: компания Intel поставляет эти процессоры только вместе с чипсетами.

Сравним основные характеристики двух таких комбинаций: Intel Atom Z530 + Intel SCH US15W и Intel Atom N270 + Intel 945GSE + Intel ICH7M.

Page 80: Современные проблемы информатики и вычислительной техники

80 `

Первый набор, образованный процессором Intel Atom Z530 и системным контроллером-концентратором Intel System Controller Hub (SCH) US15W, имеет площадь лишь 650 кв.мм и характеризуется чрезвычайно низким энергопотреблением. По сравнению с другими экономичными чипсетами контроллер-концентратор Intel SCH US15W, размеры которого составляют (22 x 22) мм, занимает до 7 раз меньше места и потребляет до 10 раз меньше электроэнергии.

Тепловой пакет (Thermal Design Power/TDP) комбинации Intel Atom Z530 + Intel System Controller Hub (SCH) US15W составляет всего 4,5 Вт, что определяется как самый низкий показатель для всех существующих x86-совместимых решений. Частота ЦП составляет 1,6 ГГц, частота системной шины – 533 МГц. Интерфейсная функциональность набора Intel Atom Z530 + Intel SCH US15W представлена портами LDVS, SDVO, ATA и USB 2.0 (8 шт.).

Производительность данного комплекта в тесте 3DMark05 составляет 115 единиц, оптимизация позволяет поднять этот показатель до полутора сотен единиц. Интегрированное графическое ядро обеспечивает аппаратное ускорение декодирования видео в форматах MPEG2, MPEG4, H.264, WMV9 и VC1.

Набор из процессора Intel Atom Z530 и интегрированного чипсета Intel SCH US15W поддерживает 400/533-мегагерцовую память DDR2 и может реализовываться на платах из материала Type 4. Блок-схема комбинации Intel Atom Z530 + Intel SCH US15W..

Page 81: Современные проблемы информатики и вычислительной техники

81 `

Второй набор, состоящий из процессора Intel Atom N270 и чипсета Intel 945GSE + Intel ICH7M, занимает площадь 2200 кв.мм и основан на 1,6-гигагерцовом ЦП с поддержкой 533-мегагерцовой системной шины. Большие размеры и энергопотребление данной комбинации (её тепловой пакет составляет около 8 Вт) компенсируется высокой графической производительностью, которую обеспечивает интегрированное графическое ядро: в тесте 3DMark05 оно приблизительно вдвое выше, чем комплект на базе процессора Intel Atom Z530.

У набора Intel Atom N270 + 945GSE + ICH7M графические интерфейсы LVDS и SDVO дополнены выходом VGA. Интересной особенностью видеоподсистемы Intel 945GSE является аппаратное ускорение воспроизведения HD-контента. К числу других достоинств рассматриваемого комплекта относятся интегрированная поддержка накопителей Serial ATA (2 порта), наличие шины SPI, шины PCI и контроллера Fast Ethernet. Подсистема ввода-вывода данного набора включает 4 порта PCI Express x1 и 8 портов USB 2.0. Поддерживается память DDR2, работающая на частоте 533 МГц; рекомендованный материал печатной платы – Type 3. Блок-схема комплекта Intel Atom N270 + Intel 945GSE + Intel ICH7M.

Page 82: Современные проблемы информатики и вычислительной техники

82 `

Можно видеть, что первый набор, состоящий из процессора Intel Atom Z530 и «1-чипового чипсета» Intel SCH US15W, как нельзя лучше подходит для использования в сверхмалогабаритных продуктах с чрезвычайно низким энергопотреблением: для мира x86 эта комбинацию можно назвать абсолютным рекордсменом как по обеспечиваемой экономии площади печатной платы, так и по обеспечиваемой экономии электроэнергии. Её целевые области применения – это сверхмалопотребляющие встраиваемые системы, в том числе мобильные и автономные (беспилотные летательные аппараты и другие).

Второй комплект – это другая сторона медали под названием Intel Atom. Смысловой центр данной комбинации заключается в высокопроизводительном графическом ядре, входящем в состав чипсета Intel 945GSE. Во-первых, это ядро служит оправданием более высокого энергопотребления.

Чипсеты имеют схожие характеристики, и каждый состоит из одной микросхемы, которая реализует функциональность, и "северного" и "южного моста". Новые чипсеты поддерживают процессоры Intel Atom с частотой системной шины 100 или 133 МГц (400/533 МГц QPB), имеют встроенный одноканальный контроллер 400- или 533-МГц памяти DDR2 (максимальный объем памяти составляет 1 Гб). Также чипсеты новой серии имеют встроенное графическое ядро Intel GMA500, которое помимо трехмерной графики обеспечивает аппаратное декодирование видеоформатов H.264, MPEG2, VC1 и WMV9. При этом поддерживаются выходы D-SUB и DVI-I, а также TV-Out. Кроме того, предусмотрен контроллер шины PCI Express spec 1.0.

Чипсеты UL11L, US15L, US15W являются составной частью платформы Centrino Atom 2, в которую также входят процессоры Atom и модули беспроводной связи Wi-Fi, WiMAX и 3G. Следует отметить, что тепловыделение чипсета UL11L составляет 1,6 Вт, а чипсетов серии US - не более 2,3 Вт. В результате, общее тепловыделение связки чипсета UL11L и процессора Atom равно 2,25 Вт! Это именно то, что нужно мобильным устройствам, поскольку беспрецедентно низкий уровень потребления энергии обеспечивает длительную продолжительность работы.

Что касается процессоров Atom N270 и Atom 230 на ядре Diamondville, то они предназначены для дешевых, экономичных и малогабаритных систем (Nettops и Netbooks) с чипсетом 945GC.Intel Core Xeon

Page 83: Современные проблемы информатики и вычислительной техники

83 `

Это МП для серверов и рабочих станций с поддержкой симметричной многопроцессорности (SMP) (в случае двухпроцессорных систем). Представлены в 2006г. В реализациях использутся несколько ядер.

Поддержка инструкций SIMD: SSE4. Реализованы технологии:

Intel Virtualization Technology — поддержка нескольких операционных систем на одном компьютере;

EIST (Enhanced Intel SpeedStep Technology) в моделях 5140, 5148LV, 5150, 5160;

Execute Disable Bit;

LaGrande Technology — enhanced security hardware extensions;

iAMT2 (Intel Active Management Technology) — удаленное управление компьютерами.

2-ядерный Dual-Core МП основан на ядре Woodcrest, ядро использует 65-нм технологический процесс.

4-ядерный Quad-Core МП основан на ядре Clovertown, ядро использует 65-нм технологический процесс.

8.1.3 Intel Itanium

Itanium был специально разработан для предоставления очень высокого уровня в параллельных вычислениях, для достижения высокой производительности без увеличения частот.

HP и Intel начали сотрудничество в области микропроцессоров в 1989 году. HP требовался процессор следующего поколения для замены удачных серий рабочих станций и серверов, построенных на базе процессоров с архитектурой PA-RISC, и компания хотела воспользоваться достижениями и опытом Intel в разработке и производстве микрочипов.

Новый процессор должен был использовать набор инструкций с явным параллелизмом (EPIC - Explicitly Parallel Instruction Computing), в котором компилятор должен выстраивать инструкции для параллельного исполнения. Были добавлены набор команд ISA (Instruction Set Architecture) и возможности для совместимости с приложениями разработанными как для Intel x86, так и для PA-RISC. Ожидалось, что разрабатываемый процессор будет доминировать на рынке серверов, рабочих станций и, возможно, даже настольных ПК, вытеснив вездесущую архитектуру x86.

Ключевые преимущества архитектуры Itanium:

Выполнение до 6 инструкций за 1 цикл.

Выполнение двух SIMD операций с плавающей точкой c 98-битными операндами за один цикл.

Увеличенные вычислительные ресурсы ядра: 256 регистров (128 целочисленных, 128 вещественных) и 64 предикатных регистра.

Большой кэш: 24 МБ у двухъядерной версии (по 12 МБ на ядро), предоставляющий данные каждому ядру со скоростью до 48 ГБ/с

За счет размещения в оперативной или кэш-памяти больших объемов данных (задачи сложного анализа, Data Mining) позволяет добиться прироста производительности при их обработке.

Большое адресное пространство: 50-битная адресация физической памяти / 64-битная адресация виртуальной памяти.

Маленькое, энергоэффективное ядро: с тех пор, как функции распараллеливания передали от Itanium к компилятору, в ядре уменьшили количество транзисторов.

В приложениях с несколькими потоками задач (за счет истинного параллелизма) производительность их обработки может быть резко увеличена.

Хорошо подходит для создания вычислительных систем, содержащих от 4 до 32 ЦП в сервере.

Первая версия процессора под кодовым именем Merced (назван в честь города вблизи Сан-Хосе, США) поступила в продажу в июне 2001г. года. В отличие, от всех последующих поколений он мог производить 4 целочисленных или 3 вещественных инструкции за один такт. Произведённый по 180 нм технологии с площадью кристалла в 25 кв.мм, напряжением на ядре 2 В и тепловыделением в 150 Вт, он работал на частотах 733 МГц и 800 МГц и частотой системной шины 266 МГц, кеш-памятью 3-го уровня размером в 2 МБ или в 4 МБ. Стоили чипы $1200 - $4000.

Широкого применения Itanium не получил. Итаник (англ. Itanic) — ироничное название, оно созвучно со словом Титаник, именующим известный затонувший гигантский трансатлантический лайнер. Архитектура

Page 84: Современные проблемы информатики и вычислительной техники

84 `

IA-64 некоторыми считается неудачной, которая стоила Intel и HP многих миллиардов долларов и не смогла достичь ожидаемых продаж в изначально запланированное время.

8.1.4 Itanium 2

Page 85: Современные проблемы информатики и вычислительной техники

85 `

8.1.5 Intel® Itanium® серии 9000

Крупномасштабные базы данных, хранилища данных, ERP, бизнес-информация и аналитика данных

Высочайшая масштабируемость для обработки самых высоких нагрузок

Надежность мирового уровня для непрерывной работы предприятий

Page 86: Современные проблемы информатики и вычислительной техники

86 `

8.1.6 Intel® Xeon®

Процессор Intel® Xeon® серии 5600 предназначен для рабочих станций высшего уровня. Безграничная многозадачность позволяет работать намного быстрее. Рабочие станции на базе процессоров Intel® Xeon® 5600 используют интеллектуальные технологии нового поколения, в том числе технологию Intel® Turbo Boost и технологию Intel® Hyper-Threading, повышающие производительность для выполнения самых сложных задач.

Разработанные специально для нового поколения интеллектуальных рабочих станций, процессоры Intel® Xeon® серии 5600, обладающие интеллектуальной производительностью, объединяют функциональные возможности высокопроизводительных вычислительных систем и обычных рабочих станций в одной мощной инновационной платформе, которая позволяет увеличивать производительность рабочих процессов и создавать цифровые макеты. С помощью профессиональных рабочих станций пользователи могут:

Создавать виртуальные аэродинамические симуляторы.

Эмулировать виртуальные тесты падения.

Выполнять виртуальные тесты технологичности и сборки.

Выполнять виртуальное тестирование проектов и предоставлять клиентам необходимую информацию, используя высокореалистичные цифровые макеты.

Процессор Intel® Xeon® серии 3600 предназначен для рабочих станций среднего уровня:

Рабочие станции базового уровня на основе 4-ядерных процессоров Intel® Xeon® серии 3400 позволяют удовлетворить ваши основные требования к созданию трехмерного контента. При этом они отличаются выдающейся производительностью, поддерживают большой объем памяти и профессиональные графические функции, превосходя обычные настольные ПК.

Процессор Intel® Xeon® серии 3400 предназначен для рабочих станций начального уровня:

Для реализации технологии Intel® Active Management Technology (Intel® AMT) необходима компьютерная система с набором микросхем, поддерживающим технологию Intel AMT, сетевым оборудованием и программным обеспечением, подключенная к источнику питания и корпоративной вычислительной сети. Для установки покупателю понадобится произвести настройки конфигурации, в процессе чего может потребоваться также ввод сценария через консоль управления или дальнейшая интеграция с имеющимися инфраструктурами защиты для активации определенной группы функций. Кроме того, может потребоваться изменение имеющихся или внедрение новых бизнес-процессов.

Технология Intel® Turbo Boost доступна только в процессорах Intel® Core™ i7 и Intel® Core™ i5. Для реализации технологии Intel Turbo Boost требуется ПК с процессором, поддерживающим технологию Intel Turbo Boost. Производительность технологии Intel Turbo Boost зависит от программного и аппаратного обеспечения, а также от общей конфигурации системы.

Показатели и сравнительные уровни производительности измеряются для конкретных конфигураций вычислительных систем и/или компонентов и приближенно отражают значения производительности продукции Intel® для указанных конкретных условий. Реальные значения производительности могут отличаться в зависимости от изменений конфигурации и настроек оборудования или программного обеспечения систем. Для оценки производительности приобретаемых систем и компонентов покупателям следует изучить и другие источники информации. Чтобы получить дополнительную информацию о тестировании производительности и о производительности продукции Intel, ознакомьтесь с ограничениями тестирования производительности продукции.

Относительная производительность каждого теста рассчитывается на основании фактического результата теста для первой платформы и присвоения ему базового значения 1.0 При расчете относительной производительности для оставшихся платформ фактический результат эталонного тестирования для основной платформы делился на каждый из результатов особого эталонного тестирования каждой из оставшихся платформ и присваивался им в качестве номера относительной производительности, коррелирующего с измеренными улучшенными показателями производительности.

Page 87: Современные проблемы информатики и вычислительной техники

87 `

Процессор Intel® Xeon® серии 3000 предназначены для серверов малого бизнеса

Серверы, созданные на базе интеллектуальных процессоров Intel® Xeon®, легко адаптируются к разнообразным рабочим нагрузкам, обеспечивая максимальную производительность, когда она необходима

Высоконадежные серверы на базе процессоров Intel® Xeon® защищают важную бизнес-информацию с помощью функции кода коррекции ошибок и поддержки избыточности хранения данных

С учетом все более активного использования компьютеров, ресурсов сети Интернет и цифровых данных, все серверы на базе процессоров Intel® Xeon® обеспечивают высокую производительность и достаточный запас ресурсов для повышения продуктивности работы сотрудников по мере развития бизнеса

8.1.7 Карты развития

В 2011г. Intel представит новую серию 32-нм процессоров Sandy Bridge для платформы LGA1155. Ключевыми особенностями этих ЦП станут: поддержка набора инструкций AVX (Advanced Vector Extensions), призванных повысить производительность ресурсоемких вычислений с плавающей точкой, внедрение технологии Turbo Boost 2.0, которая предполагает более гибкую регуляцию частоты ядер процессора, интеграция довольно производительного встроенного видеоядра и скромные значения TDP. Модельный ряд Sandy Bridge совместим с материнскими платами на чипсетах Intel 6 Series, в частности, Intel P67 Express (Cougar Point).

Page 88: Современные проблемы информатики и вычислительной техники

88 `

Как и сейчас, процессоры LGA1155 будут разделены на классы – Core i3 (бюджетный сегмент, базовая производительность), Core i5 (среднеценовой сегмент, достаточная производительность в большинстве приложений, поддержка Turbo Boost 2.0) и Core i7 (high-end-сегмент, максимально возможное быстродействие в рамках серии).

Обозначения будут следующими: для двухъядерных Sandy Bridge – Core i3-21xx и Core i5-23xx, для четырехъядерных – Core i5-24xx, Core i5-25xx и Core i7-27xx. Кроме того, некоторые модели будут отмечены суффиксами:

K – разблокированный множитель;

S – 4-ядерные процессоры со сниженным до 65 Вт TDP;

T – 2/4-ядерные процессоры с TDP до 35 Вт/45 Вт;

M – мобильные процессоры;

QM – 4-ядерные мобильные процессоры;

XM – топовые 4-ядерные мобильные процессоры.

Объем кэш-памяти третьего уровня для 2-ядерных Sandy Bridge составит 3 МБ, 4-ядерные Core i5 будут оборудованы 6 МБ кэша, 4-ядерные Core i7 – 8 МБ сверхбыстрой памяти. Кристалл Sandy Bridge, включающий, в том числе, контроллер памяти DDR3 и графическое ядро, будет монолитным.

Номинальные частоты будущих Core i3/i5/i7-2000. будут весьма умеренными. Возможно, с переходом на 22-нм техпроцесс (Ivy Bridge), 4-гигагерцовый барьер будет, наконец, преодолен.

Настольные процессоры Sandy Bridge

Page 89: Современные проблемы информатики и вычислительной техники

89 `

Мобильные процессоры Sandy Bridge

Процессоры Intel® Core™ предыдущего поколения обеспечивают достаточную производительность, надежность и энергоэффективность настольных ПК. Это планы Intel по настольным процессорам на 2009г. – 2010г. годы

В карте определены категории МП:

Extreme – экстремальные.

Best – наилучшие.

Better – лучше.

Good – хорошие.

Page 90: Современные проблемы информатики и вычислительной техники

90 `

Intel® Core™2 Duo. Это 2-ядерные процессоры. Энергоэффективность и производительность многозадачных и мультимедийных приложений. Обеспечивают высокую производительность, энергосбережение и быстродействие в многозадачных средах, повышая продуктивность работы вашей компании. Настольные ПК на базе процессоров Intel Core 2 сочетают в себе высокую скорость и эффективное энергосбережение, позволяя выполнять больше работы за меньшее время и при этом сократить энергопотребление в среднем на 50%.

Intel® Core™2 Quad. Это 4-ядерные процессоры. Обеспечивают эффективную поддержку мультимедийных приложений и многозадачности, позволяя создавать более быстрые и бесшумные настольные ПК и рабочие станции с пониженными требованиями к охлаждению. Это стало возможным благодаря тому, что они построены на базе микроархитектуры Intel® Core™ и 45-нм технологии с использованием гафния.

Процессоры Intel® для серверов обеспечивают высокую энергоэффективность и производительность бизнес-приложений, интенсивно использующих данные. Многоядерные серверные процессоры Intel® используются в разнообразных 64-разрядных серверах◊, позволяя оптимизировать и масштабировать вычислительные среды и максимально повысить эффективность использования серверов, предоставляя при этом необходимые ресурсы для дальнейшего развития.

Процессор Intel® Xeon® серии 5600

Новое поколение интеллектуальных процессоров для серверов и рабочих станций на базе микроархитектуры Intel® под кодовым названием Nehalem

Автоматически увеличивайте тактовую частоту процессора с помощью технологии Intel® Turbo Boost и используйте технологию Intel® Hyper-Threading (Intel® HT) по мере необходимости

Page 91: Современные проблемы информатики и вычислительной техники

91 `

Автоматически регулируйте энергопотребление с помощью технологии Intel® Intelligent Power, чтобы объединить передовой уровень энергоэффективности с интеллектуальной производительностью, адаптирующейся к рабочей задаче

Новое поколение технологии Intel® Virtualization обеспечивает лучшую в своем классе производительность виртуализации, высочайшую масштабируемость, гибкость работы и более простое управление серверами

Процессор Intel® Xeon® серии 6500

Процессоры для двухпроцессорных серверов, поддерживающие большой объем памяти

Интеллектуальная масштабируемая производительность, оптимизированная для эффективной виртуализации информационного центра

Идеально подходит для высокопроизводительных вычислительных систем и консолидации серверов с прогнозируемой рабочей нагрузкой

Ниже карта развития (RoadMap) этих МП на вторую половину 2010г. года.

В таблицах ниже:

Processor Number = Номер процессора.

Cache = Кэш-память.

Clock Speed = Тактовая частота.

Max TDP = Макс. расч. Мощность.

Memory Type = Тип памяти.

Intel® HD Graphics = Intel® HD Graphics.

Number of Cores = Число ядер.

Процессор Intel® Core™ i3 для мобильных ПК является базовой моделью нового семейства процессоров Intel, которая обеспечивает необходимый уровень производительности для умной работы в многозадачных средах, а также длительное время автономной работы. В таблице:

Page 92: Современные проблемы информатики и вычислительной техники

92 `

Процессоры Intel® Core™ i5 для мобильных ПК откроют перед вами новые возможности для использования преимуществ умной производительности. ПК на базе процессоров Intel® Core™ i5 для мобильных ПК обеспечивает надежную производительность для повседневных приложений, а также возможность увеличивать быстродействие для выполнения ресурсоемких задач. При этом они могут дольше работать в автономном режиме, обеспечивая вам дополнительную свободу действий.

Intel® Core™ i7 для мобильных ПК. Передовой процессор Intel® Core™ i7 теперь доступен и для мобильных ПК, обеспечивая интеллектуальную производительность для обработки самых ресурсоемких задач, в том числе для создания цифрового видео и запуска современных компьютерных игр. Переход на ноутбуки с процессорами Intel® Core™ i7 для мобильных ПК обеспечивает большую пропускную способность памяти, ускоряющую выполнение задач.

Page 93: Современные проблемы информатики и вычислительной техники

93 `

Intel® Core™ i7 Extreme Edition для мобильных ПК. Ноутбуки с процессорами Intel Core i7 Extreme Edition для мобильных ПК поддерживают профили памяти Intel® Extreme Memory Profiles (Intel® XMP) и инструмент оверклокинга Intel Mobile Iron City 1.3, которое обеспечивают невероятную производительность и длительное время автономной работы вашего ноутбука.

8.1.8 Наборы микросхем

Предназначены для связи процессора (CPU) с материнской платой. Включают две ИС:

Северный мост (например, IOH) - для связи с устройствами памяти.

Южный мост (например, ICH) – для устройств ввода/вывода.

Page 94: Современные проблемы информатики и вычислительной техники

94 `

Набор Intel X58 Express

Платформы настольных ПК с набором микросхем Intel® X58 Express и процессором Intel® Core™ i7 обеспечивают высокую производительность и поддержку современных технологий для компьютеров массовой и производительной категорий.

Набор микросхем Intel X58 Express поддерживает процессоры Intel Core i7, изготовленные по 45-нм технологии, которые имеют пропускную способность 6,4 ГТ/с и 4,8 ГТ/с благодаря технологии Intel® QuickPath Interconnect (Intel® QPI)

Особенности:

Северный мост X58 IOH - хаб ввода вывода. Обслуживает новую «системную» шину QPI (QuickPath Interconnect, 20 линий) с полосой пропускания до 25,6 Гбайт/с и 36 линий PCI Express 2.0. Кроме того, поддерживается установка двух видеокарт x16 или четырех видеокарт x8 PCI Express* 2.0. Северный мост X58 IOH не содержит контроллер системной памяти, который перенесен в процессор Core i7. Поэтому северный мост теперь носит название IOH (хаб ввода-вывода), а не MCH (хаб контроллера памяти), как было ранее. Выделяемая чипом мощность (точнее, TDP) не превышает 24,1 Вт, а предельно допустимая температура Tcase max = 100°C.

Южный мост ICH10/ ICH10R – для связи с периферией. Размер кристалла у этого чипа 9,4 х 8,64 мм, он упакован в BGA-корпус 31 х 31 мм с 676 выводами. Максимальная потребляемая им мощность составляет 3,2-4,5 Вт. Чип включает блоки контроллеров ICH10 (без поддержки RAID – массив независимых диковых накопителей) или ICH10R (с поддержкой RAID). Поддерживаются 12 USB 2.0 портов, 6 PCI, связь с гигабитной локальной сетью, высокоточное аудио, 6 портов SATA. Размеры чипа – 31х31 мм, термопакет – 4,5 Вт, максимальная температура корпуса – 105°C.

Для связи мостов по-прежнему используется шина DMI с общей (в 2 направлениях) пропускной способностью 2 Гбайт/с (по сути, это 4 линии PCI Express).

Page 95: Современные проблемы информатики и вычислительной техники

95 `

Набор Intel X48 Express

Настольные ПК на базе набора микросхем Intel® X48 Express и процессоров Intel® Core™2 Duo, Intel® Core™2 Quad или Intel® Core™2 Extreme устанавливают новые стандарты производительности.

Набор микросхем Intel X48 Express обладает расширенными функциями и поддерживает эти процессоры.

Особенности:

Северный мост X48 МСH - хаб контроллера памяти. Обслуживает «системную» шину с полосой пропускания до 12,8 Гбайт/с. Поддерживается установка двух видеокарт x16 PCI Express 2.0. Для внешней памяти использован 2-канальный контроллер памяти DDR3.

Южный мост ICH9/ ICH9R – для связи с периферией. Чип включает блоки контроллеров ICH9 (без поддержки RAID – массив независимых диковых накопителей), или ICH9R (с поддержкой RAID). Поддерживаются 12 USB 2.0 портов, 6 PCI, связь с гигабитной локальной сетью, высокоточное аудио, 6 портов SATA.

Для связи мостов по-прежнему используется шина DMI с общей (в 2 направлениях) пропускной способностью 2 Гбайт/с (по сути, это 4 линии PCI Express).

Выделяемая чипом мощность (точнее, TDP) не превышает 30,5 Вт, а предельно допустимая температура Tcase max = 100°C.

Page 96: Современные проблемы информатики и вычислительной техники

96 `

Набор Intel X38 Express

Настольные ПК на базе набора микросхем Intel® X38 Express и процессора Intel® Core™2 Duo, Intel® Core™2 Quad или Intel® Core™2 Extreme устанавливают новые стандарты производительности. Особенности:

Северный мост X38 МСH - хаб контроллера памяти. Обслуживает «системную» шину с полосой пропускания до 10,6 Гбайт/с. Поддерживается установка двух видеокарт x16 PCI Express 2.0. Для внешней памяти объемом до 8 Гб использован 2-канальный контроллер памяти DDR2 или DDR3.

Южный мост ICH9/ ICH9R – для связи с периферией. Чип включает блоки контроллеров ICH9 (без поддержки RAID – массив независимых диковых накопителей), или ICH9R (с поддержкой RAID). Поддерживаются 12 USB 2.0 портов, 6 PCI, связь с гигабитной локальной сетью, высокоточное аудио, 6 портов SATA.

Для связи мостов используется шина DMI с общей (в 2 направлениях) пропускной способностью 2 Гбайт/с (по сути, это 4 линии PCI Express).

Выделяемая чипом мощность (точнее, TDP) не превышает 30,5 Вт, а предельно допустимая температура Tcase max = 100°C.

Page 97: Современные проблемы информатики и вычислительной техники

97 `

Характеристики и преимущества:

Системная шина частотой 1333/1066/800 МГц. Поддерживает процессоры Intel® Core™2 Duo и Intel® Core™2 Quad с технологией виртуализации Intel® (Intel® VT)±, процессор Intel® Pentium® и процессор Intel® Celeron®.

Интерфейс PCI Express * 2.0. PCI Express 2.0 обеспечивает пропускную способность до 16 Гбит/с на порт, что вдвое превосходит характеристики пропускной способности PCIe* 1.0. PCI Express 2.0 значительно улучшит графическую производительность системы при использовании режима Dual X16.

Технология Intel® Fast Memory Access. Усовершенствованная магистральная архитектура контроллера-концентратора памяти (Memory Controller Hub, MCH) позволяет повысить производительность системы благодаря оптимизации использования доступной пропускной способности и сокращению времени задержки при доступе к памяти.

Поддержка двухканальных модулей памяти DDR3 обеспечивает пропускную способность до 21,2 ГБ/c (оперативная память DDR3 1333 с пропускной способностью 10,6 ГБ/с, работающая в двухканальном режиме) и адресацию памяти до 8 ГБ для получения более быстрого отклика системы и поддержки 64-разрядных вычислений.

Поддержка двухканальной памяти DDR2 обеспечивает пропускную способность до 12,8 ГБ/c (оперативная память DDR2 800 с пропускной способностью 6,4 ГБ/с, работающая в двухканальном режиме) и адресацию памяти до 8 ГБ для получения более быстрого отклика системы и поддержки 64-разрядных вычислений.

Технология Intel® Flex Memory обеспечивает простоту модернизации благодаря поддержке модулей памяти различного объёма, работающих в двухканальном режиме.

Технология Intel® High Definition Audio¹ (Intel® HD Audio) . Встроенная аудиоподсистема обеспечивает высочайшее качество цифрового звука и расширенные возможности, например, поддержку воспроизведения нескольких аудиопотоков и изменение назначения разъемов.

Технология Intel® Matrix Storage² (Intel® MST) с добавлением дополнительного жесткого диска обеспечивает более быстрый доступ к цифровым фотографиям, аудио- и видеофайлам с помощью RAID-массивов уровней 0, 5 и 10, а также повышенную защиту данных жесткого диска с помощью RAID-массивов уровней 1, 5 и 10. Поддержка внешнего интерфейса SATA* (eSATA) обеспечивает внешнюю пропускную способность до 3 Гб/с.

Технология Intel® Rapid Recovery. Современная технология Intel для защиты информации предусматривает создание точки восстановления, которая будет использоваться для быстрого возобновления работы системы в случае отказа жёсткого диска или повреждения большого объёма

Page 98: Современные проблемы информатики и вычислительной техники

98 `

данных. Для восстановления избранных файлов диск с резервными данными можно подключать в режиме "только чтение".

Serial ATA (SATA) 3 Гб/с. Высокоскоростной интерфейс памяти поддерживает более быструю передачу данных и улучшенные средства доступа к данным.

eSATA*/Множитель порта eSATA - это интерфейс SATA предназначенный для подключения внешних устройств SATA. Он предоставляет канал с пропускной способностью 3 Гбит/с, что исключит задержки при нехватке пропускной способности, характерные для современных устройств внешнего хранения данных. Intel также поддерживает использование множителей портов на аппаратном уровне. Совместное использование множителей порта, eSATA и технологии Intel® Matrix Storage обеспечит высокую гибкость для внешних систем хранения данных с возможностью дальнейшего расширения.

Отключение порта SATA позволяет при необходимости включать и отключать порты SATA. Данная функция обеспечивает дополнительную защиту данных, предотвращая незаконное изъятие или внесение данных через порты SATA. Особенно данная функция будет полезна для внешних портов eSATA.

Отключение порта USB. Позволяет включать и отключать порты USB в зависимости от необходимости. Данная функция обеспечивает дополнительную защиту данных, предотвращая незаконное изъятие или внесение данных через порты USB.

Набор Intel® P55 Express

Intel P55 Express – набор микросхем "пятидесятой серии", относящийся к среднему классу. Это первая одночиповая системная логика серии, выпущенная в сентябре 2009г. для 4-ядерных Core i5 серии 7xx и Core i7 серии 8xx (Lynnfield), рассчитанных на установку в разъём LGA1156.

Обратите внимание, что этот чипсет изначально предназначался для процессоров без встроенного графического ядра – в нём отсутствует шина FDI (Flexible Display Interface), отвечающая за связь интегрированной графики с чипсетом. Этим объясняется тот факт, что хотя на платы с P55 можно устанавливать чипы Core i3/i5 со встроенным видео, системой интегрированное ядро определяться не будет и альтернативы дискретной графике в этом случае нет.

Микросхема P55 Express носит название Intel BD82P55 PCH – аббревиатура PCH расшифровывается как "Platform Controller Hub", то есть "контроллер-коммутатор платформы". Связь с процессором осуществляется через шину DMI с пропускной способностью 2 Гбайт/с.

Микросхема выпускается по 65-нанометровой технологии, её размеры – 27х27 мм. На официальном сайте Intel не указан термопакет чипа, но поскольку он не слишком отличается от ICH10, вряд ли его TDP намного выше 4,5 Вт.

Page 99: Современные проблемы информатики и вычислительной техники

99 `

Наборы Intel® H55, H57, Q57 Express

Наборы микросхем H55, H57 и Q57 Express (кодовое название Ibex Peak) были представлены одновременно с выходом процессоров Core i3/i5 (Clarkdale) в январе 2010г. Все 3 модели ориентированы на массовый рынок и совместимы с любыми процессорами Core i3/i5/i7 для разъёма LGA1156.

Конструктивно чипсеты построены на основе P55 и отличаются от него нюансами. Их принципиальное отличие от P55 – поддержка шины FDI, то есть возможность работы со встроенным в процессоры Core i3/i5 графическим ядром Intel HD Graphics. При этом они не поддерживают режим CrossFire/SLI, хотя через контроллер процессора обеспечивают один полноскоростной интерфейс PCI Express 2.0 x16. Вряд ли это аппаратные ограничения (было бы просто невыгодно производить несколько вариантов столь близких по конструкции микросхем). Скорее, дело в позиционировании этих чипсетов как массовых моделей.

Коммутационные возможности младшего в семействе H55 Express (BD82H55 PCH) в точности повторяют таковые у "южного моста" ICH10 – фактически, это тот же самый кристалл (и по интерфейсам, и по количеству поддерживаемых портов), только дополненный шиной FDI.

Наборы логики H57/Q57 Express (BD82H57 PCH и BD82Q57 PCH) по портам и интерфейсам полностью соответствуют уровню P55. В отличие от H55, здесь на месте и поддержка RAID-массивов. Разница между H57 и Q57 для подавляющего большинства пользователей чисто символическая. Например, в H57 реализована технология защиты от несанкционированного доступа Intel Identity Protect (Sentry Peak), а в Q57 её нет; в Q57 есть система низкоуровневого блокирования доступа к данным Intel Anti-Theft Technology (TDT), а в H57 её нет и т.д. При этом Q57 позиционируется как решение для офисных систем, поэтому в нём предусмотрена также технология удалённого администрирования Active Management 6.0. С этими непринципиальными различиями проще всего ознакомиться в таблице.

Page 100: Современные проблемы информатики и вычислительной техники

100 `

Все три чипсета H55, H57 и Q57 Express отличаются от P55 Express также встроенной технологией Intel Quiet System Technology (QST), обеспечивающей автоматическое управление вентиляторами системы нагрузки и температуры компонентов, что позволяет понизить уровень шума, издаваемого компьютером.

Микросхемы выпускаются по 65-нм технологическим нормам, размеры чипа – 27х27 мм, максимальная температура корпуса – 111°C, заявленный термопакет H55/H57 Express – 5,2 Вт, Q57 Express – 5,1 Вт.

Таким образом, H55 обладает базовой функциональностью, H57 является его апгрейдом для мультимедийных систем, а Q57 – для офисных. Старшие чипсеты позволяют организовывать RAID, а Q57 к тому же поддерживает Intel Anti-Theft Technology. Цена этих чипсетов для производителей материнских плат будет отличаться незначительно, $40 за H55 и P55, $43 за H57 и $44 за Q57.

Page 101: Современные проблемы информатики и вычислительной техники

101 `

.

Процессоры Core i3. i5 способны работать на материнских платах, оснащенных чипетами Intel H57, H55, P55 или Q57.

Процессоры Core i7 (Bloomfield) 9xx серии устанавливаются в разъём LGA1366, который появился немного раньше, чем LGA1156. Bloomfield 9xx несколько бытрее, чем Core i5 и i7, но стоят они намного дороже. Процессоры Bloomfield способны работать на материнских платах с чипсетом X58.

Page 102: Современные проблемы информатики и вычислительной техники

102 `

1.1. Процессоры AMD

Advanced Micro Devices, Inc. (AMD) — американский производитель интегрированной электроники. Второй по величине производитель x86 и x64-совместимых процессоров, а также крупнейший поставщик графических процессоров (с 2006г. после покупки компании ATI Technologies ), чипсетов для материнских плат и флеш-памяти. Во 2-м квартале 2010г. Nvidia впервые уступила первенство на рынке дискретных видеоадаптеров своему основному конкуренту, компании AMD. По данным Mercury Research, в указанный период AMD заняла 51,1 % рынка по объему поставок, тогда как Nvidia — 48,8 %.

Производственные мощности компании расположенны в США, Германии, Канаде, Китае, Сингапуре и Таиланде. Своих заводов нет.

1.1.1. История процессоров AMD

Микроархитектура K5

Процессор K5 был разработан компанией AMD как конкурент процессору Intel Pentium. Он был представлен в 1995, более, чем на год, позже Pentium, к тому же AMD не удавалось в достаточном количестве производить K5, работающие на первоначально запланированной частоте. Процессор содержал 4,3 миллиона транзисторов и обладал хорошей x86 совместимостью.

Фирма AMD долго, но безуспешно пыталась сделать более мощный, чем у Intel аналог процессора Pentium. Это привело к тому, что AMD отказалась от попыток его самостоятельного создания и приобрела компанию NexGen, вместе с её интеллектуальной собственностью и разработанным ею новым, более производительным чем у Intel, процессором. Однако, несмотря на большую производительность AMD по каким-то причинам упростила этот процессор, что привело к отставанию его производительности от конкурента. Процессор постепенно улучшался и последние его модели обогнали Pentium, однако исправить испорченную репутацию это не помогло.

Микроархитектура K6

Процессор K6 был представлен компанией AMD в 1997г. Первоначально разработан компанией NexGen под названием Nx686. После поглощения NexGen корпорацией AMD доработан (прежде всего добавлен блок FPU) и производился как AMD K6. Процессор обладает суперскалярной мультиконвеерной архитектурой. При его разработке закладывалась совместимость с существующими системами на базе Intel Pentium. При продвижении на рынке он позиционировался как процессор, имеющий такую же производительность, как и аналогичный Pentium, но при этом стоящий существенно меньше. Процессор

Page 103: Современные проблемы информатики и вычислительной техники

103 `

K6 оказал серьёзное влияние на компьютерный рынок и составил существенную конкуренцию процессорам Intel.

Микроархитектура K7

Представлены в 1999г. Выпускались до 2005г.. AMD Athlon - торговое название высокопроизводительного x86-совместимого МП с микроархитектурой K7. Новый процессор был призван конкурировать с Pentium III компании Intel, а название Athlon, в переводе с древнегреческого языка означающее «чемпион», «победитель игр», отражало претензию компании AMD на лидерство своего процессора.

Новое ядро K7 имело множество нововведений, что позволило значительно поднять производительность процессора Athlon по сравнению с предыдущими процессорами компании, в результате чего на момент анонса Athlon являлся самым производительным процессором архитектуры x86, превосходя своего основного конкурента — Intel Pentium III.

AMD продолжает использовать название Athlon и в последующих сериях своих микропроцессоров.

Микроархитектура K8

K8 - x86 совместимая микроархитектура. Впервые представлена в 2003г.: были выпущены первые процессоры Opteron, предназначенные для серверного рынка. Теперь на основе K8 выпускаются семейства Opteron, Athlon64, Athlon64X2, Turion64. Является кардинально переработанным, значительно улучшенным и расширенным вариантом микроархитектуры K7. В новых процессорах удалось преодолеть ряд проблем, являвшихся ахиллесовой пятой K7, а также внесён ряд принципиально новых решений.

В микроархитектуре K8 используется конвейер с 12 стадиями, значительная часть которых приходится на декодер инструкций.

Микроархитектура K8+

Процессоры AMD K8+, представлены в 2008г..Базируются на усовершенствованной архитектуре K8, дополненной рядом технологий, применяющихся в процессорах архитектуры K10, такими как усовершенствованный контроллер памяти, раздельное управление частотами ядер, поддержка шины Hyper-Transport 3.0.

Микропроцессоры K8 являются суперскалярными, мультиконвеерными процессорами с предсказанием ветвлений и спекулятивным исполнением. Как и процессоры AMD K7 и Intel P6 они теоретически способны исполнять до 3-х инструкций за один такт. Как и любой современный x86 процессор K8 вначале перекодирует внешний сложный CISC набор x86 инструкций во внутренние RISC-подобные микрооперации, которые в свою очередь уже идут на исполнение.

Микроархитектура K10

Представлена в 2007г. Процессоры серии K10 имеют интегрированный контроллер памяти (двухканальный DDR2, DDR3 поддерживается процессорами, произведёнными только по 45-нм техпроцессу), разделяемый кэш третьего уровня и поддерживают набор инструкций AMD64.

Предполагалось, что следующее после K8 семейство процессоров AMD будет носить кодовое имя К9, но компания AMD не использует это название (предположительно из-за созвучности с «canine» - «собачий»). В некоторых источниках новое семейство называется K8L, однако по официальным данным оно имеет наименование K10.

1.1.2. AMD Athlone

Athlon 64 — первый 64-битный процессор для домашних пользователей и мобильного применения компании AMD, который был представлен в 2003г. Процессор построен на архитектуре AMD64 и относится к 8 поколению (K8).

О начале разработки архитектуры K8 впервые было заявлено в 1999г. Процессоры, основанные на данном ядре, должны были стать первыми 64-битными процессорами AMD, полностью совместимыми со стандартом x86.

Page 104: Современные проблемы информатики и вычислительной техники

104 `

В 2006г. AMD объявила о прекращении выпуска всех процессоров на Socket 939, всех 1-ядерных socket AM2 процессоров и всех 2×1 MB X2-процессоров (за исключением FX-62).

Основным качеством процессоров Athlon 64 является интегрированный в ядро контроллер памяти, чего не было в предыдущих поколениях МП. Не только то, что данный контроллер работает на частоте ядра процессора, но также и то, что из связки процессор-память исчезло лишнее звено — северный мост, позволило существенно уменьшить задержки при обращении к ОЗУ.

Athlon 64 также обладает технологией изменения тактовой частоты процессора, названной Cool'n'Quiet. Если пользователь запускает приложения, не требующие от процессора большой вычислительной мощности, то процессор самостоятельно понижает свою тактовую частоту, а также напряжение питания ядра. Применение данной технологии позволяет снизить тепловыделение при максимальной нагрузке с 89Вт до 32Вт.

Параметр Значения

Технология, нм 90 - 65

Частота CPU, ГГц 1.8 -2.8

Транзисторов в CPU, млн

122 -221

Ядра 1 и 2

Кэш L1, КБ 64 (данные) + 64 (команды) на ядро

Кэш L2, МБ 0.5 или 1

Кэш L3, МБ 6

Шина HyperTransport 3.0

Память, МБ DDR2

Напряжение, В 1.4

TDP, Вт 35 - 89

Разъем Socket 940

Цена, $ 65 - 698

1.1.3. AMD Geode

Geode — серия МП совместно с набором логики ввода-вывода, выпускаемая компанией AMD и нацеленная на рынок встроенных процессоров.

Серия была разработана в компании National Semiconductor в 1999г. AMD приобрела разработку в 2003г. c намерением пополнить свою линейку x86-совместимых встраиваемых процессоров.

AMD развивает серию в двух направлениях: варианты GX и LX, основой для которых послужил MediaGX, и вариант NX, основанный на дизайне Athlon.

Вся серия совместима с процессорами x86, но обладает меньшей потребляемой мощностью и меньшей стоимостью. В результате, процессоры прекрасно подходят для построения тонких клиентов, пользовательских приставок и встроенных контроллеров.

Page 105: Современные проблемы информатики и вычислительной техники

105 `

Название Geode произошло от одноимённого геологического термина, описывающего полость, заполненную кристаллами.

Geode GXm

Клон Cyrix MediaGXm. При запросе CPUID выдаёт «CyrixInstead». Ядро основано на MediaGX

350-нм 4-слойный металлический КМОП.

Инструкции MMX/AMD 3D Now!

16 КБ кэш I уровня с обратной записью

PCI-контроллер

контроллер 64-битной памяти SDRAM

Дополнительная микросхема CS5530 для поддержки графики и звука.

Архитектура VSA

Разрешения 1280x1024x8, 1024x768x16

Питание: 3,3 В ввод/вывод, 2,9 В ядро

Geode GXLV

Ядро основано на MediaGX.

250-нм 4-слойный металлический КМОП.

Питание: 3,3В - ввод/вывод; 2,2В, 2,5В, 2,9В – ядро.

1.1.4. AMD Opteron

Линейка Opteron. Включает 2 серии: 6000 и 4000

Opteron 4000 (кодовое название Lisbon). Разработаныспециально для “облачных” вычислений в так называемых “гиперскалярных дата-центрах” либо “облачных” компьютерных системах. Имеет самое низкое энергопотребление среди серверных процессоров. Начальная цена 99$.

Page 106: Современные проблемы информатики и вычислительной техники

106 `

Параметр Значения

Технология, нм 45

Частота CPU, ГГц 1.7 – 2.8

Транзисторов в CPU, млн

382

Ядра 4 - 6

Кэш L1, КБ 64 на ядро

Кэш L2, МБ 2 или 3

Кэш L3, МБ 6

Шина 2 линии HyperTransport 3.0

Память, МБ 2 х DDR3-1333

Напряжение, В 0.65 – 1.4

TDP, Вт 32 - 75

Разъем Socket 32

Цена, $ 40 - 80

Opteron 6000 (кодовое название Magny-Cours). Основана на новой архитектуре AMD Direct Connect Architecture 2.0 с поддержкой до 48 ядер в 4-прроцессорной конфтгурации сервера.

Итак, компания опубликовала свои планы на 2010г. и 2011г. год, касающиеся линейки серверных процессоров Opteron. Несомненно, наибольший интерес вызвала серия 6000 (платформа G34 Maranello). Итак, уже в 2010г. году появятся первые процессоры этой серии под кодовым названием Magny-Cours. Они будут выполнены по 45-нм технологическому процессу и будут включать в себя как 8, так и 12 процессорных ядер.

На смену им в 2011г. придут 32-нм процессоры Interlagos. Это будут, естественно, более мощные решения с меньшим энергопотреблением, количество ядер в которых будет достигать 16, хотя будут представлены и 12-ядерные решения. На одной платформе можно будет использовать 2 или 4 процессора 6000 серии. Параллельно будет развиваться более бюджетная линейка 4000 (платформа G32 San Marino). В 2010г. в этой серии появятся 45-нм процессоры Lisbon с 4 и 6 ядрами, а в 2011г. году – 32-нм Valencia с 6 и 8 ядрами. Одна платформа сможет поддерживать лишь 2 процессора серии 4000. Обе линейки основаны на новой архитектуре DCA 2.0, которая включает четырехканальный контроллер памяти для серии 6000 и двухканальный контроллер для серии 4000.

Серверы на базе нового 6 ядерного процессора AMD Opteron™ способны успешно справляться с любыми задачами, обеспечивая превосходную эффективность работы и низкий уровень энергопотребления по доступной цене. Серверы на базе технологии AMD представляют собой единую платформу, которая обеспечивает выполнение любых бизнес-задач и позволяет снизить расходы на электроэнергию. Инновационный 6 ядерный процессор обеспечивает более высокую производительность, демонстрируя те же показатели энергопотребления и тепловыделения, что и 4 ядерные процессоры AMD Opteron™.

Page 107: Современные проблемы информатики и вычислительной техники

107 `

Наличие 6 ядер в каждом разъеме обеспечивает повышенную производительность и эффективность энергопотребления (по сравнению с предыдущими поколениями) в многозадачных средах, таких как виртуализация, обслуживание баз данных и веб-серверов.

Основные характеристики процессора:

Поддержка технологии HyperTransport™ позволяет снизить контрольный трафик между процессорами, ускоряя выполнение запросов в 4- и 8-процессорных серверных системах и повышая производительность требовательных к объему кэш-памяти программ, таких как приложения баз данных, виртуализации, а также вычислительных приложений, интенсивно использующих ресурсы процессора.

Технология управления питанием AMD-P. Процессоры AMD Opteron имеют встроенный набор функций управления питанием AMD-P, включая технологии AMD PowerNow!™, AMD CoolCore™ и Dual Dynamic Power Management™. Эти технологии снижают расход электроэнергии и стоимость эксплуатации систем на базе AMD Opteron.

Технология виртуализации AMD Virtualization™ (AMD-V™). Для поддержки аппаратного перевода адресов из виртуальной в физическую память были разработаны функции Rapid Virtualization Indexing и Tagged-TLB. Это позволяет снизить время задержки, повысить производительность и увеличить количество виртуальных машин на каждой физической машине, обеспечивая эффективность и гибкость ИТ-среды.

Показатели энергопотребления и тепловыделения идентичны показателям 4 ядерных процессоров AMD Opteron™.

На 20-50% более высокая производительность, чем у 4 ядерного процессора AMD Opteron, при том же уровне энергопотребления.

1.1.5. AMD Phenome

В 2010г. компания AMD продолжит полагаться на микроархитектуру K10 и не планирует выпускать новых 32-нм процессоров, по крайней мере, до 2011г. В результате, согласно официальному роадмапу компании на текущий год, выпуска действительно громких новинок не предвидится. Таким образом, основным оружием AMD в вечной её борьбе с Intel станет агрессивная ценовая политика. Однако совсем уж без новинок поклонники компании не останутся.

Page 108: Современные проблемы информатики и вычислительной техники

108 `

Параметр Значения

Производство, год 2007

Технология, нм 65 - 45

Микроархитектура K10

Частота CPU, ГГц 1.8 - 2.6

Транзисторов в CPU, млн 122 -221

Ядра 2 - 4

Кэш L2, KБ 512 на ядро

Кэш L3, МБ 2

Шина HyperTransport 3.0

Память, МБ DDR3

Напряжение, В 1.2

TDP, Вт 65 - 125

Разъем AM2+

Цена, $ 65 - 698

Каждое из четырёх ядер процессора Phenom обладает собственным 64 Кб собственной кэш-памяти L1 для инструкций и 64 Кб кэш-памяти L1 для данных, что в сумме составляет 512 Кб кэш-памяти L1 на процессор. Суммарный объём кэш-памяти L2 составляет 2 Мб, по 512 Кб на каждое ядро. Помимо этого, архитектуры Barcelona и Stars подразумевают наличие 2 Мб кэш-памяти L3. В отличие от кэш-памяти уровней L1 и L2, эксклюзивных для каждого ядра, кэш-память L3 динамически распределяется между всеми ядрами.

Page 109: Современные проблемы информатики и вычислительной техники

109 `

Среди ключевых характеристик, присущих новым 4-ядерным процессорам Phenom, следует отметить следующие функциональные возможности:

Наличие нового планировщика задач с плавающей запятой, теперь поддерживающего 36 новых 128-битных операций

Поддержка 128-битных операций SSE, появившихся в дополнение к возможностям прежней 64-битной архитектуры

Возможность обработки двух операций SSE и одного SSE переноса за такт

Буфер модуля выборки инструкций стал 32 байтным (ранее 16 байт)

Модуль предсказания ветвлений с 512-ходовым предсказанием непрямых ветвлений

Производительность кэша данных увеличена с одной 64-битной загрузки за такт до одной 128-битной загрузки за такт

Производительность кэша данных L2 - контроллера памяти увеличена с 64-битной загрузки на такт до 128-битной загрузки за такт

Реализация шины HyperTransport 3.0 позволила увеличить пропускную способность до 20,8 Гб/с

Реализация технологии AMD Virtualization Technology с функцией быстрой индексации Rapid Page Indexing

В дополнение также необходимо отметить появление в процессорах Phenom поддержки системы динамического управления тактовой частотой по каждому ядру. Поскольку архитектура не позволяет регулировать напряжение питания каждого ядра в независимом режиме, дополнительное энергосбережение обеспечивается снижением тактовой частоты каждого ядра в режиме простоя.

Page 110: Современные проблемы информатики и вычислительной техники

110 `

Помимо этого, дополнительное энергосбережение обеспечивает технология AMD CoolCore, позволяющая отключать не используемые функциональные модули ядра. Имеется также технология Dual Dynamic Power Management, которая позволяет задавать независимые уровни напряжения для ядра процессора и интегрированного контроллера памяти. Дополнительная функция AMD Wideband Frequency Control обеспечивает наиболее эффективный с точки зрения потребления энергии режим с сохранением производительности при изменении режимов производительности. Наконец, технология Multi-Point Thermal Control, функционирующая за счёт интегрированных в ядро термодатчиков, обеспечивает термозащиту чипа, следя за уровнем температуры и автоматически снижая производительность до разумных температурных пределов.

Среди прочих энергосберегающих технологий также следует отметить появление режима питания C1E, активирующегося в момент перехода всех ядер чипа в ждущее состояние. При этом отключается шина HyperTransport, память переходит в режим пониженного питания и значительным образом снижаются внутренние тактовые частоты процессора. Также любопытна функция Processor Power Saving Indicator, "сообщающая" регулятору напряжения о снижении нагрузки, а также обеспечивающая поддержку регуляторов напряжения с PSI. Вместе с сохранением обратной совместимости процессоров AMD Phenom с VID-управлением плат под разъём AM2, новая последовательная система VID-управления обеспечивает 7-битную точность регулировки напряжения (с шагом 12,5 мВ).

Ключевые отличия и сходства предыдущей платформы AM2, новоявленной AM2+ и грядущей AM3 приведены на скриншоте ниже.

Подведём черту под этой краткой характеристикой новых процессоров Phenom. Все новые чипы производятся на фабрике AMD Fab 36 в Дрездене, Германия, с использованием 65 нм техпроцесса и применением технологии SOI (Silicon on Insulator). Каждый 4-ядерный процессор содержит порядка 463 млн. транзисторов, при этом площадь кристалла составляет 285 мм². Все новые процессоры Phenom выпускаются в 940-контактных корпусах Organic micro-PGA (micro Pin Grid Array) и могут использоваться с материнскими платами, оснащёнными разъёмом Socket AM2+. Номинальное напряжение питания ядра составляет 1,1 – 1,25 В, максимальная температура – 70°C; TDP нормируется на уровне 95 Вт. Официальным пресс-релизом компания AMD известила о начале поставок двух процессоров Phenom. Модель Phenom 9600 (тактовая частота 2,3 ГГц) модель Phenom 9500 (тактовая частота 2,2 ГГц) поставляются по цене $283 и $251 в оптовых партиях от тысячи штук. Судя по данным презентаций компании, следующим – ориентировочно, в начале следующего года, появится процессор AMD Phenom 9700, который, помимо более высокой тактовой частоты, будет отличаться более высоким TDP

Page 111: Современные проблемы информатики и вычислительной техники

111 `

Следующий элемент новой платформы AMD Spider – линейка наборов логики AMD 7 Series, которая в настоящее время включает в себя наиболее производительную версию AMD 790FX, вариант для массовых ПК - AMD 790X, а также бюджетную версию AMD 770.

Все три чипсета выполнены с соблюдением норм 65 нм техпроцесса с SOI и, по заявлению представителей AMD, обладают вдвое меньшим энергопотреблением против предыдущего поколения наборов логики AMD. Так, для "старшего чипсета" 790FX TDP заявлен на уровне всего 10 Вт.

Один из главных релизов 2010г. от AMD - семейство 6-ядерных процессоров под кодовым названием Thuban. Производиться новинки будут на базе уже существующих 6-ядерных решений для серверных платформ Opteron, и будут оснащаться встроенным контроллером оперативной памяти стандарта DDR3. Тактовые частоты будут несколько снижены по сравнению в целях снижения уровня тепловыделения.

1.1.6. AMD Sempron

Sempron, выпущенный в 2004г. компанией AMD — низкобюджетный настольный ЦП, пришедший на замену процессору Duron и являющийся прямым конкурентом процессорам Celeron компании Intel.

При разработке его названия AMD использовало латинское слово semper, обозначающее всегда/каждый день, намекая, что основной нишей данного процессора являются простые приложения для повседневной работы.

Процессор AMD Sempron™ обеспечивает наилучшую производительность в своем классе при работе с приложениями для дома и офиса. Функциональные характеристики процессора AMD Sempron™ включают технологию AMD64, технологию HyperTransport™, общий объем высокоскоростного кэша до 256 КБ, один 16-разрядный канал данных с двусторонней системной шиной до 1600 МГц и интегрированный контроллер памяти DDR2.

Высокая производительность по доступной цене.

Page 112: Современные проблемы информатики и вычислительной техники

112 `

Процессор AMD Sempron обеспечивает лучшую в своем классе производительность приложений для дома и офиса.

Процессор AMD Sempron предназначен для выполнения повседневных вычислительных задач.

Полноценная функциональность для расширения вычислительных возможностей

Процессор AMD Sempron позволяет наслаждаться динамическими возможностями Интернета благодаря поддержке потокового видео и аудио.

Процессор AMD Sempron экономит время и усилия; он позволяет системе быстро запускать и загружать приложения.

Процессор AMD Sempron обеспечивает качественную работу приложений, которые позволяют общаться с семьей, друзьями и коллегами.

Расширенные архитектурные характеристики процессора AMD Sempron™ обеспечивают высокую производительность и полноценную функциональность по доступной цене. Данные характеристики включают:

Технология AMD64;

Технология HyperTransport;

Высокоскоростной производительный кэш с общим объемом до 256 КБ;

One 16-bit/16-bit link @ up to 1600MHz full duplex system bus technology,

Интегрированный контроллер памяти DDR2 в некоторых моделях;

Встроенная система улучшенной защиты от вирусов*, которая совместно с операционной системой Microsoft® Windows® XP SP2 обеспечивает защиту от вирусов, червей и других вредоносных атак. В сочетании с защитными программами функция улучшенной защиты от вирусов является компонентом общей системы безопасности, которая позволяет защитить данные.

Page 113: Современные проблемы информатики и вычислительной техники

113 `

Параметр Значения

Технология, нм 90

Частота CPU, ГГц 1.8 – 2.3

Транзисторов в CPU, млн

69

Ядра 1

Кэш L1, КБ 64 (данные) + 64 (команды)

Кэш L2, КБ 256 или 512

Шина HyperTransport 3.0. 16 разрядов 800 МГц

Память, МБ DDR2

Напряжение, В 1.25 - 1.4

TDP, Вт 69

Разъем Socket 754 mPGA 939 Socket AM2

Цена, $ 41

1.1.7. AMD Phenome

Один из главных релизов 2010г. от AMD - семейство 6-ядерных процессоров под кодовым названием Thuban. Производиться новинки будут на базе уже существующих 6-ядерных решений для серверных платформ Opteron, и будут оснащаться встроенным контроллером оперативной памяти стандарта DDR3. Тактовые частоты будут несколько снижены по сравнению в целях снижения уровня тепловыделения.

1.1.8. Мобильные от AMD

Компания AMD выпустила несколько мобильных процессоров, включая мобильные версии процессора К6, а также модели Mobile Athlon 64, Mobile Athlon 4, Mobile Duron и Mobile Athlon XP-M. Они основаны на существующих процессорах для настольных компьютеров и дополнены возможностями технологии PowerNow!, которая позволяет динамически управлять частотой и напряжением питания процессора, а также общим потреблением энергии.

Процессор AMD Duron.

(изначально имевший кодовое название Spitfire) является вариантом процессора AMD Athlon и так же, как Celeron, стал разновидностью процессоров Pentium II и Pentium III (современные процессоры Celeron основаны на Pentium 4). Процессор Duron аналогичен Athlon с уменьшенной кэш-памятью второго уровня при сохранении всех остальных возможностей.

Page 114: Современные проблемы информатики и вычислительной техники

114 `

Поскольку процессор Duron основан на ядре Athlon, в нём используется шина данных, работающая на частоте 200МГц, и поддерживается расширенный набор инструкций 3DNow!.

Mobile Athlon и Mobile Athlon XP.

Несмотря на то что процессор К6 обеспечивал неплохую производительность в своём классе, его быстродействия было недостаточно, чтобы конкурировать с процессорами Mobile Pentium III и Mobile Celeron, работающими с тактовой частотой более 600 МГц. В мае 2001г. года компания AMD представила процессоры Mobile Athlon (известные, как Athlon 4) и Mobile Duron, которые, как и настольные версии, конкурировали с процессорами Intel Pentium III и Celeron.

Mobile Athlon XP-M.

Новая версия мобильного процессора Athlon, которая называется Athlon XP (или XP-M), появилась в июле 2002г. В основном она представляет собой улучшенную версию предидущей модели процессора Athlon с добавлением поддержки новых инструкций SSE от Intel. Последние модели Athlon XP содержат встроенную кэш-память второго уровня объёмом 512 Кбайт, работающую на полной частоте ядра.

Модификация архитектуры Athlon XP направлена на уменьшение времени выполнения инструкций за один такт, что позволяет "медленному" Athlon XP побеждать "быстрый" Pentium 4 в некоторых рабочих (и игровых) задачах.

Mobile Athlon 64.

Этот процессор основан на Athlon 64 - первом процессоре для настольных компьютеров, обеспечивающем как 32-разрядные, так и 64-разрядные вычисления. При этом демонстрируется высокая производительность для любых 32-разрядных приложений и готовность к выполнению 64-разрядных. Последний факт имеет особое значение, поскольку в 2005г. компания Microsoft представила первую 63-разрядную версию Windows XP.

Процессор производится по 0,13-микронной технологии для 754-контактного разъёма microPGA и содержит 105,9 млн. транзисторов. Процессор содержит кэш-память второго уровня объёмом 1 Мбайт. А также поддерживает технологию энергосбережения AMD PowerNow!.

Компания AMD готовит новый 2-ядерный процессор для нетбуков под названием Consesus. Здесь так же стоит вопрос о потребляемой мощности. Компания заявляет, что устройства на новом процессоре будут позиционироваться как высокопроизводительные рабочие машинки, так что низкое энергопотребление для них отойдёт на второй план.

Ниже планы AMD по мобильным процессорам на 2011г. Карта развития (RoadMap) мобильных МП от AMD включает средства для платформ Tigris (2009г.), Danabe (2010г.), Sabune (2011г.).

Определены целевые сегменты:

Desktop – настольные ПК.

Thin & Light – тонкие и легкие.

Page 115: Современные проблемы информатики и вычислительной техники

115 `

Ultrathin – сверхтонкие.

Netbook – нетбуки.

На 2009г. намечен Caspian. Для сегментов настольных и тонких ПК. 2-ядерный мобильный МП для платформы Tigris.

На 2010г. намечен Champlane. Для сегментов настольных и тонких ПК. 4-ядерный мобильный МП для платформы Danube. Он будет иметь 2 Мб кэш-памяти (по 512 кб на каждое ядро) и поддерживать работу с оперативной памятью стандарта DDR3. Кроме того, планируется выпуск Champlain и в двухядерном варианте. Данная платформа будет поддерживать интегрированную графику с DirectX 10.1.

На 2011г. намечен выпуск мобильной платформы Sabune с гибридом CPU (центральный процессор) и GPU (графический процессор) компания AMD запланировала на 2011г. В ее состав входит микросхема Llano, относящаяся к категории APU (Accelerated Processing Unit) — решение, объединяющее функции центрального и графического процессора. Llano будет выпускаться по нормам 32-нм и сможет работать с памятью DDR3-1600 МГц. Другой компонент платформы, AMD SB9xxM, обеспечит поддержку USB 3.0 (16 портов) и SATA (6 портов). Для высокопроизводительных ноутбуков будет предусмотрена установка дискретных графических решений нового поколения.

1.1.9. AMD RoadMap

AMD Fusion (fusion - сплав) — кодовое наименование будущей микропроцессорной архитектуры, которая в настоящее время разрабатывается американской компанией AMD. Суть проекта «AMD Fusion» заключается в объединении центрального многозадачного универсального процессора с графическим параллельным многоядерным процессором в одном кристалле. Процессоры создаваемые по такой микроархитектуре называются APU — Accelerated Processing Unit (ускоренный процессорный элемент).

Компания AMD публично объявила о двух реализациях процессора Fusion

Серия Falcon.

Процессоры серии Falcon анонсированы в июле на AMD Technology Analyst Day. Целевой рынок процессора Bulldozer из серии Falcon — настольные системы с энергопотреблением от 10 Вт до 100 Вт. Bobcat, процессор из серии Falcon, ориентирован на рынок мобильных телефонов, UMPC и карманных устройств с энергопотреблением от 1 Вт до 10 Вт.

Серия Swift.

Процессоры серии Swift будут базироваться на основе архитектуры Stars и выполнены на 45-нм техпроцессе. Они будут нацелены на рынок ноутбуков. Заявлена поддержка стандарта памяти DDR3. Процессоры серии Swift будут иметь полностью DirectX10-совместимое графическое ядро на основе чипа Radeon RV710. Будет присутствовать полная поддержка технологий PowerXpress и Hybrid CrossFireX. TDP: 5-8 Вт (под нагрузкой), 0.6-0.8 Вт (в режиме простоя). Есть две версии процессоров Swift: White Swift (основан на 1-м ядре) и Black Swift (основан на 2-х ядрах).

1.1.10. Наборы микросхем AMD использует чипсеты других производителей.

Одной из самых характерных (и не самых приятных) черт платформы AMD является излишне большое количество типов поддерживаемых ею процессорных разъемов.

NVIDIA.

Чипсет NVIDIA nForce4 стал первым чипсетом для платформы AMD K8 с поддержкой шины PCI Express. Контроллер памяти у них интегрирован в процессор, производительность всех современных чипсетов практически одинакова. Именно отличная "функциональность" чипсетов nForce4 и стала причиной того, что они в настоящее время являются основой для "топовых" материнских плат для процессоров Athlon 64 в исполнении Socket 939.

Базовая версия чипсета nForce4 соединяется с процессором по двунаправленной 800МГц шине Hyper Transport, поддерживает 20 каналов шины PCI Express, 2 независимых двухканальных контроллера

Page 116: Современные проблемы информатики и вычислительной техники

116 `

SerialATA с пропускной способностью 150МБ/с, что позволило значительно расширить функциональные возможности по настройке и использованию RAID массивов.

Версия nForce4 Ultra отличается от базовой более скоростной 1000МГц шиной HyperTransport, а также сетевым гигабитным контроллером, содержащим аппаратный ускоритель обработки сетевых пакетов Active Armor (программно-аппаратный брандмауэр). Интегрированный блок фильтрации TCP/UDP пакетов на аппаратном уровне освобождает центральный процессор от значительной части работы по фильтрации сетевого трафика, а простой в обращении программный брандмауэр обеспечивает защиту системы от вирусов или атак из Интернета.

Помимо этого, пропускная способность контроллеров SerialATA увеличена до 300 Мбайт/с. В чипсет введена поддержка жестких дисков с технологией NCQ (Native Command Queuing, - оптимизированное исполнение запросов), а также функция "Hot Swap" ("горячая" замена SATA-дисков). Фактически, nForce4 Ultra стал первым чипсетом, в котором реализована полноценная поддержка спецификации SerialATA II.

Самая мощная (и, естественно, самая дорогая) модификация - nForce4 SLI обеспечивает использование в системе одновременно двух PCI Express видеокарт NVIDIA в режиме SLI.

Все чипсеты линейки nForce4 имеют только один более или менее выраженный недостаток - интегрированный 8-канальный звуковой контроллер соответствует уже устаревшему стандарту AC'97 (поддержка High Definition Audio отсутствует).

В самое ближайшее время ожидается появление новой версии "топового" чипсета NVIDIA - nForce 4 SLI 16x. Главной его особенностью станет поддержка функционирования двух видеокарт в режиме SLI, причем обе они смогут работать в полноценном режиме PCI-E x16.

VIA

В предыдущие годы лидирующие позиции на рынке наборов микросхем для процессоров AMD занимала компания VIA. Даже в настоящее время, когда ее позиции серьезно пошатнулись под напором NVIDIA, рыночная доля VIA все еще достаточно велика. VIA анонсировала К8Т890 - первый свой набор микросхем с интерфейсом PCI Express для Athlon 64.

В отличие от "топовых" решений NVIDIA, K8T890 позиционируется компанией VIA в качестве недорогого Mainstream-решения, обладающего современными возможностями. От своего предшественника - K8T800 Pro, новый чипсет отличаются только типом графического интерфейса: контроллер шины AGP8Х был заменен контроллером интерфейса PCI Express (20 независимых линий).

Page 117: Современные проблемы информатики и вычислительной техники

117 `

В то время как nForce4 состоит из одной микросхемы, K8T890 имеет классическую двухчиповую архитектуру. Чипсет от VIA состоит из северного и южного моста, которые соединяются фирменной шиной Ultra V-Link с пропускной способностью 1066 Мбайт/с. Северный мост набора микросхем К8Т890 подключается к CPU по двунаправленной системной шине HyperTransport (частота работы 1 ГГц, ширина - 16 бит в каждом направлении), в нем же располагаются все 20 каналов PCI Express.

SiS. Компания SiS является пионером в продвижении наборов микросхем с интерфейсом PCI Express для процессоров Athlon 64. Чипсет SiS756 был официально объявлен еще в марте 2004г. Он выполнен по классической двухмостовой схеме и по своей функциональности очень близок к VIA K8T890.

Page 118: Современные проблемы информатики и вычислительной техники

118 `

Северный мост является PCI Express-мостом, имеющим только графический интерфейс PCI-E х16 и соединенный с южным мостом по собственному протоколу SiS MuTIOL, который обеспечивает пропускную способность до 1 Гбайт/с. Южный мост SiS965 гораздо более функционален, чем VIA VT8237R: он предлагает два дополнительных порта шины PCI-E х1, а также четыре порта SerialATA/150, хотя очередь команд NCQ не поддерживается. Полная же поддержка SerialATA/300 будет реализована только в новом южном мосте SiS966, который должен появиться ближе к концу года. Кроме того, сетевой контроллер SiS965 поддерживает гигабитный Ethernet.

ATI.

Попытку конкуренции с ведущими производителями чипсетов для AMD64 предприняла и компания ATI, выпустившая два набора микросхем - интегрированный Xpress 200 (кодовое название RS480), оснащенный графическим ядром на базе Radeon X300, и его дискретный вариант Xpress 200Р (кодовое название RX480). Их основные характеристики схожи с чипсетом VIA K8T890: у Xpress 200 классическая архитектура с двумя мостами, северные мосты оснащены 1-ГГц системной шиной Hyper Transport, одним портом PCI Express х16 и четырьмя - PCI Express xl. Официальным южным мостом чипсета является микросхема IXP400, однако возможно использование еще и микросхемы М1567 тайваньской компании ULi, поскольку обе они связываются с северным мостом по шине PCI Express.

Базовая модификация Xpress 200 оснащена встроенным графическим ядром на базе Radeon X300 (с поддержкой DirectX 9), работающим на частоте 350 МГц, поэтому ему требуется активное охлаждение. Ядро обладает двумя пиксельными конвейерами с одним текстурным блоком каждый, а также четырьмя вершинными блоками - что очень даже неплохо для встроенной графики. При этом возможно как использование как разделяемой системной памяти UMA (Unified Memory Architecture), так и выделенный кадровый буфер (до 128 Мбайт), а также комбинировать оба эти способа (технология HyperMemory).

ULi.

Среди множества самых разнообразных решений, присутствующих сегодня на рынке PCI Express-чипсетов для процессоров AMD, одним из самых оригинальных является чипсет M1695, не так давно выпущенный тайваньской компанией ULi (бывшая ALi). Подход ULi к построению чипсета весьма удачен: оба его моста связаны 8-битной двунаправленной шиной HyperTransport, что дает дополнительную свободу выбора южных мостов.

Поскольку архитектура HyperTransport поддерживает последовательное подключение нескольких устройств, ничего не мешает использовать, наряду с южным мостом M1567 (или вместо него), например, чипа AMD-8132 с поддержкой PCI-X (может использоваться в High-End рабочих станциях и серверах) или еще один мост с графическим интерфейсом PCI-E x16.

Page 119: Современные проблемы информатики и вычислительной техники

119 `

При подключении северного моста M1695 к штатному M1567 на материнской плате могут быть реализованы одновременно три графических интерфейса - PCI Express x16, AGP 8х и PCI (последний - чисто теоретически, потому что мало кто сегодня помнит о существовании PCI-видеокарт). При этом в северном мосту имеется только графический интерфейс PCI-E x16 (плюс 4 дополнительных канала PCI-E x1), который может быть сконфигурирован как два канала PCI-E x8, т.е. чипсет поддерживает режим SLI для двух графических карт.

Южный мост M1567 содержит привычные интерфейсы - два порта UltraATA/133, два порта SATA/150, восемь портов USB 2.0, звук AC97 2.3, 6 слотов шины PCI и 100-Мбит/с LAN, а также полноценный интерфейс AGP 8X.

Page 120: Современные проблемы информатики и вычислительной техники

120 `

1.2. Процессоры SPARC

SPARC (Scalable Processor ARChitecture) — масштабируемая процессорная архитектура — архитектура RISC-микропроцессоров, первоначально разработанная в 1985 компанией Sun Microsystems.

Архитектура SPARC является открытой — это значит, что:

архитектура системы команд SPARC опубликована как стандарт IEEE 1754—1994;

спецификации SPARC доступны для лицензирования любой компанией или частным лицом и дают возможность разрабатывать свои собственные решения;

развитием архитектуры SPARC занимается независимая некоммерческая организация SPARC International, Inc., основанная в 1989 году. Членство в SPARC International открыто для всех желающих.

Для производства процессоров с архитектурой SPARC достаточно купить у SPARC International, Inc. лицензию на архитектуру системы команд ($99) и разработать свою реализацию архитектуры, либо закупить готовую реализацию (что несколько дороже).

Процессоры SPARC

Год Название Модель Частота, (МГц) Версия архитектуры

2007. UltraSPARC T2 (Niagara 2) Sun SME1908A 1000-1400 V9 / UA 2007г.

2008. UltraSPARC T2 Plus (Victoria Falls) Sun SME1910A 1200-1400 V9 / UA 2007г.

2008. UltraSPARC T2 Sun T5240 1200 V9 / UA 2007г.

2008. SPARC64 VII (Jupiter) Fujitsu 2400-2520 V9/JPS2

2009 UltraSPARC RK (Rock) Sun SME1832 2300 V9 / UA

Существовало несколько ревизий архитектуры SPARC. Самыми последними являются версии 8 и 9. Версия 8 архитектуры SPARC описывает 32-разрядный МП, тогда как версия 9 — 64-разрядный.

Sun Ultra Sparc T2. Процессор UltraSparc T2 [66-67-68-69-71-72] позиционируется производителем не только как сугубо серверное решение — он также может использоваться в хранилищах данных, сетевых устройствах (инфраструктуры WiMAX, 3G/4G) и в готовых решениях (так называемых set-top-box).

Процессор представляет собой высокоинтегрированную многоядерную и многопоточную систему на кристалле (SoC).

Page 121: Современные проблемы информатики и вычислительной техники

121 `

Поскольку современные процессоры работают быстрее, чем память, обычно процессор тратит значительную часть своего времени, ожидая данные из памяти. Процессоры UltraSPARC T2 содержат 4, 6 или 8 независимых 64-разрядных SPARC-ядер, каждое из которых имеет аппаратную поддержку выполнения восьми независимых потоков. Поток может быть частью параллельной программы или отдельной программой.

В сумме процессор может обрабатывать до 64 потоков (это свойство особо востребовано в 10-й версии Solaris OS). Тактовые частоты для этого процессора доступны в диапазоне 900-1400 МГц. На каждое ядро в процессоре имеется по одному криптографическому сопроцессору (так называемые процессоры "безопасности").

Процессор Ultra SPARC T2 имеет также встроенный контроллер для шины PCIe и два 10 Гбит/с контроллера для сетей Ethernet.

Каждое процессорное ядро содержит два целочисленных исполнительных блока, один блок с плавающей точкой, графический блок и блок криптографии. Потоки статически ассоциированы с каждым исполнительным модулем, до четырех потоков на целочисленный модуль.

Аппаратно SPARC-ядро поддерживает восемь потоков. Поддержка включает в себя полный регистровый файл (с восемью регистровыми окнами), включая большинство привелегированных регистров на каждый поток. Потоки разделяют между собой кэши инструкций и данных, блок вычислений с плавающей точкой (наличия одного блока с плавающей точкой вполне достаточно для многопоточных коммерческих приложений, в которых операции с плавающей точкой занимают порядка 1% от общего потока инструкций).

Каждое ядро имеет встроенный 8 канальный кэш инструкций первого уровня размером 16 Кб, интегрированный с 4 канальным кэшем данных первого уровня. Кэш-память второго уровня составляет 4 Мб и разделяется всеми восемью ядрами процессора. Кэш второго уровня разделен на восемь банков, которые поддерживают восемь последовательных запросов к памяти для обеспечения высокой

Page 122: Современные проблемы информатики и вычислительной техники

122 `

пропускной способности канала памяти. Пропускная способность подсистемы памяти при этом достигает 60 Гб/с.

Восемь процессорных ядер Niagara 2 связаны матричным переключателем с восемью банками 16-канального модульно-ассоциативного кэша второго уровня, общим объемом 4 Мбайт (у Niagara 1 — 3 Мбайт). Поскольку нагрузка на кэш в новом процессоре возросла вдвое, а объем кэша увеличился лишь на треть, для поддержания высокой производительности процессора разработчикам пришлось увеличить пропускную способность системы памяти. Вместо четырехканальной памяти DDR2, реализованной в Niagara 1, в процессоре используются четыре сдвоенных канала FBDIMM DRAM. Несколько большая по сравнению с DDR 2 энергоемкость новой подсистемы памяти с лихвой окупается приростом производительности — по оценкам разработчиков, в 1,7 раза.

UltraSPARC T2 также может быть сконфигурирован на работу в режимах четырех или двух банков кэша второго уровня (с размерами 1/2 и 1/4 общего размера кэша соответственно).

Процессор оборудован 4 контроллерами памяти и может работать с 64 банками памяти стандарта FB-DIMM. Каждый из котроллеров памяти обслуживает обращения к памяти от пары банков кэша второго уровня. В сокращенной конфигурации обращение к памяти может задействовать один из FBD-каналов (в нормальном режиме используются два канала). Каждое обращение к памяти выполняется независимо и может иметь независимый размер памяти и тип динамической памяти (DIMM). К примеру, различное количество ranks или различная длительность CAS-импульса. Программное обеспечение не должно занимать адресное пространство, более чем в четыре раза большее, чем наименьший объем в обращении кэша, поскольку линии кэша перекрываются вызовами кэша.

Частота DRAM-контроллера такая же, как и у DDR-шины, которая является удвоенной частотой DDR-памяти. FBDIMM-линии работают на частоте в шесть раз большей, чем DDR-шины [70-71-72].

Процессоры семейства Niagara считывают инструкции парами (четная и нечетная). При этом четная инструкция сразу же поступает в конвейер, а нечетная сохраняется в буфере до тех пор, пока не придет ее очередь (в каждый данный момент времени в конвейере находится одна инструкция). В ядре процессора Niagara 2 количество буферов инструкций увеличено до восьми (у каждого потока теперь свой буфер). В конвейере Niagara 2 появились дополнительные стадии. Конвейер целочисленных операций стал восьмистадийным, тогда как при выполнении инструкций, работающих с данными с плавающей запятой, конвейер насчитывает 12 стадий.

Некэшируемый (NCU) блок выполняет декодирование передач, адресованных в пространство ввода-вывода, и направляет их на соответствующие блоки (DMU, CCU). В дополнение к этому NCU работает основным (maintains) регистром статуса для внешних прерываний. Возможно также обнаружение коллизий прерываний, система почтовых ящиков, INTX, MSI, MSI-X.

Блок системного интерфейса (System Interface Unit (SIU)) соединяет DMU и кэш второго уровня. SIU — точка доступа для кэша L2 в сетевую подсистему. Интерфейс SIU-L2 Cache также является точкой захвата для доступа к шине PCI-Express.

UltraSPARC T2 имеет высокоскоростной последовательный интерфейс (50 Мб/с SSI), который соединяет его с программируемым массивом (FPGA), служащим для связи с загрузочным ПЗУ. Также SSI поддерживает режим простых линий ввода-вывода.

В дополнение процессор содержит два контроллера PCI Express, два 1/10 Гб/с Ethernet контроллера MAC-уровня с интерфейсами XAUI. Реализация PCIe включает поддержку спецификации 1.0а, поддерживаются конфигурационные режимы х1, х4, х8 при скорости данных 2,5Гб/с. Интерфейсы PCIe и XAUI могут быть запрограммированы для поддержки коротких и длинных связей, для работы и в блейд-приложениях, и в приложениях бэк-зоны.

Интерфейс PCIe оперирует на частоте 2,5 ГГц. Возможно управление уровнем сигнала для оптимизации передачи на короткие или длинные линии связи. Его реализация также включает поддержку транспортного уровня, уровня связи логического подуровня физического уровня.

Блок сетевых интерфейсов имеет две линии интерфейсов со скоростями 10 Гб/с, два XAUI-интерфейса, каждый из которых состоит из четырех полосного коммутатора CML, поддерживает дифференциальные

Page 123: Современные проблемы информатики и вычислительной техники

123 `

сигналы в полосе 3,125 ГГц с программируемым уровнем сигнала. Каждый интерфейс имеет четыре приемо-передающие пары. Поддерживаются контрольные сигналы MDIO, аппаратное формирование и нумерация пакетов, классификация пакетов "на лету" на базе информации 1-4 уровней стека протоколов. Блок также имеет множественную поддержку прямого доступа в память и аппаратную поддержку виртуализации.

10-гигабитный Ethernet MAC (10GbE) поддерживает 16 MAC-адресов на порт, поддержку кадров длиной до 9216 байт, поддержку пауз между кадрами по стандарту IEEE 802.3. Возможна настройка времени паузы. Поддерживаются сброс пакетов, содержащих ошибки, проверка ошибок пакетов, вычисление и проверка контрольной суммы, сброс пакетов с ошибкой контрольной суммы.

1.3. Процессоры ARM

Процессоры ARM нового поколения будут устанавливаться как в смартфоны, так и нетбуки, сообщает ZDNet со ссылкой на заявление директора по мобильным решениям ARM Роба Кумбса (Rob Coombs). В настоящее время процессоры ARM устанавливают только в мобильные телефоны и смартфоны. Кумбс подчеркнул, что в нетбуки будут устанавливаться процессоры ARM Cortex-A8 и Cortex-A9. Первые нетбуки с чипами ARM будут анонсированы в течение нескольких месчцев.

Процессор Cortex-A8 станет преемником чипа ARM11, на базе которого построено большинство мобильников с микроархитектурой ARM. В настоящее время инженеры ARM тестируют чипы ARM Cortex-A8 на гигагерцевых скоростях. Процессор Cortex-A9 будет представлять собой двухъядерную версию ARM Cortex-A8. Он появится в 2010г.

Представители ARM сообщили, что чип ARM Cortex-A8 уже лицензировали для своих продуктов такие компании, как Samsung, STMicroelectronics, Texas Instruments, Broadcom, PMC-Sierra, Panasonic и Freescale. На лицензирование Cortex A9 подали заявки NEC, Nvidia, STMicroelectronics, TI и Toshiba.

О планах по выпуску устройств на базе процессоров ARM объявила компания Nvidia. Она намерена установить в мобильное интернет-устройство (MID), занимающее промежуточное положение между нетбуком и смартфоном, процессор ARM11.

В настоящее время основным поставщиком процессоров для нетбуков является компания Intel, которая раскритиковала чипы ARM. В частности, Intel считает, что процессор ARM не позволяет реализовать весь потенциал смартфона iPhone 3G.

Наиболее популярным в настоящее время можно назвать одноядерный дизайн ARM11, лицензированный многими производителями чипов. Перспективными разработками ARM, к которым проявляют наибольший интерес потенциальные партнёры, можно назвать Cortex A8 (рабочее название Tiger, базовая архитектура ARM7) и многоядерный Cortex A9. Так, при сравнимом с ARM11 энергопотреблении, ядро Cortex A8 обеспечивает втрое большую вычислительную мощность. Энергопотребление Cortex A8 составляет порядка 500 мВт и сравнимо с младшей моделью Intel Atom. Ядро Cortex A8 входит в МП OMAP от Texas Instruments.

Рынок платформ для ультрамобильных ПК в настоящее время можно оценить как переполненный самыми разнообразными предложениями. С одной стороны, сюда приходят игроки, привычные для рынков смартфонов, коммуникаторов, телефонов и карманных ПК, принося с собой свои традиционные решения, преимущественно на процессорных ядрах ARM, MIPS или SH, с другой – всё громче заявляют о себе поставщики платформ х86. Противостояние, лишь тлевшее до сих пор ввиду малого пересечения рынков, совсем скоро войдёт в фазу открытого огня.

1.4. Процессоры VIA

Самым сильным конкурентом для Intel Atom должны стать новые процессоры от компании VIA — серия Nano 3000, ориентированные именно на компактность и экономичность нетбуков. Также преимуществом этих устройств станет повышенная производительность при работе с мультимедиа, трёхмерной графикой и играми.

Page 124: Современные проблемы информатики и вычислительной техники

124 `

В нетбуке от Hewlett-Packard установлен процессор VIA C7-M. Модель работает на частоте 1,6 ГГц и обладает объемом кэш-памяти L2 равным 128 Кб.

И снова непонятные результаты. Если между группой из VIA C7-M, Celeron M 353 и Atom N270 все более или менее понятно, то как Atom N280 вырвался так далеко вперед, неясно. Разумеется, дополнительные 60 МГц не могли оказаться такого влияния на результат, как и возросшая шина. Может, ответ кроется в работе HT. Можно предположить, что в этом тесте у Atom N270 эта технология не работала, а в Atom N280 была активирована.

Исходя из проведенных тестов, можно сказать, что самым слабым оказался процессор VIA C7-M. Модель Celeron M 353 держится на уровне чипов Atom, которые, в случае оптимизации приложения под многопоточность, конечно же вырываются вперед.

Page 125: Современные проблемы информатики и вычислительной техники

125 `

9 Современные микроконтроллеры

9.1 МК от Atmel

9.2 МК от TI

Платформа MSP430. МК с ультранизким энергопотреблением. Использована RISC архитектура с новыми решениями с одновременным управлением цифровыми и аналоговыми компонентами для экономии энергопотребления. Цена от 0,25$.

Платформа C2x. 32-разрядный МК для управления устройствами в реальном времени. Включает дешевые, высоко интегрированные Piccolo и мощные Delphino. Области применения: управление электродвигателями, интеллектуальные сенсоры. Цена от 1$.

Платформа Stellaris. Дешевые МК, используется 32-разрядное ядро Cortex-M3. Цена от 1,85$.

Платформа TMS570. МК для приборов повышенной надёжности для автотранспорта. Цена 7…18$.

Платформа Hercules. Многоядерные МК, включающие 3 ядра на основе ARM. Платформа обеспечивает дополнительные встроенные функции комплексной безопасности при осуществлении масштабирования, подключения и опций памяти. Цена от 5$.

Платформа ARM. МК, построенные с использованием RISC архитектуры от компании ARM. Цена 5,,,20$.

9.2.1 MSP430

Платформа включает в себя 16-разрядные RISC-процессоры смешанных сигналов со сверхнизким энергопотреблением, является оптимальной для широкого спектра энергосберегающих портативных устройств. TI обеспечивает мощную поддержку для разработчиков MSP430, включая техническую документацию, обучение, инструментальные средства и ПО. Области применения MSP430

Емкостные сенсорные решения.

Беспроводные решения.

Счетчики расхода энергоресурсов.

Портативные медицинские устройства.

Безопасность.

Получение энергии из окружающей среды.

USB.

Перспективы платформы.

Page 126: Современные проблемы информатики и вычислительной техники

126 `

Основные сведения:

Сверхмалое энергопотребление.

16-разрядная RISC-архитектура.

Новые низкие цены! Цены МК начинаются от 25 центов. Конкурирующие недорогие 8-разрядные изделия требуют активизации ЦП для каждого преобразования, выполняемого АЦП, и для передачи загруженных данных.

Встроенный в устройства MSP430 10-разрядный АЦП с контроллером передачи данных может управлять выборками АЦП во всем диапазоне адресов памяти – и все это без непроизводительных затрат со стороны ЦП!

Сокращение времени пребывания в активном режиме приводит к экономии энергии.

ЦПУ остается свободным для других, более сложных задач.

Производится интеллектуальная автономная оцифровка данных.

Имеет место детерминированный режим работы. Структура устройства:

Устройства MSP430 интегрированы с интеллектуальной периферией, включая 10-разрядный АЦП (ADC10) с контроллером передачи данных, компараторы, SPI, I2C и 16-разрядные таймеры. Очередные устройства семейства MSP430G2xx будут дополнительно иметь ёмкостные сенсорные контакты ввода-вывода и интерфейс UART. Эта интеллектуальная периферия позволит МК семейства MSP430G2xx выполнять больше задач независимо от ЦП, снижая среднее потребление тока и позволяя ЦП сосредоточить ресурсы на более сложных задачах.

9.2.2 C2x

МК совмещают в себе встроенные управляющие периферийные устройства с вычислительной мощью 32-разрядной архитектуры. Все МК C28x™ на 100 % программно совместимы с высокоскоростными 12-разрядными АЦП и современными ШИМ-генераторами.

Page 127: Современные проблемы информатики и вычислительной техники

127 `

МК C2x имеют архитектуру аналогичную DSP первого поколения C1x, но обладают повышенной производительностью и более широкими функциональными возможностями. Все МК C2x могут использовать по 64К слов памяти программ и данных, имеют по 16 16-разрядных портов ввода/вывода и последовательный порт.

МК C2x имеют возможность использования внешнего контроллера ПДП. Умножитель МП помимо операций умножения позволяет выполнять за один такт возведение в квадрат.

Области применения - управление электродвигателями, интеллектуальные сенсоры. Серия включает 32-разрядные МК для управления устройствами в реальном времени. В серию входят:

C24x.

C28x с ФТ.

Piccolo - дешевые высоко интегрированные.

Concerto.

Delphino - формат с ПТ.

Перспективы платформы.

МК имеют производительность до 300 миллионов инструкций с плавающей точкой в секунду (MFLOPS), работают на частоте 150 МГц и являются самыми дешевыми контроллерами с плавающей точкой.

Все МК семейства F2833x являются высоко интегрированными устройствами и содержат:

12-битный АЦП, на сегодняшний день самый быстрый АЦП, встроенный в МК,

до 18 каналов ШИМ, 6 из которых – с разрешающей способностью 150 пс.

Последовательные интерфейсы включают: CAN, I2C, UART, SPI и McBSP.

Вся встроенная Flash и 32 кбайт RAM защищены 256-битным паролем.

16/32-битный интерфейс внешней памяти поддерживает асинхронную SRAM, flash, ROM.

Контроллер имеет 88 цифровых портов ввода/вывода.

Page 128: Современные проблемы информатики и вычислительной техники

128 `

9.2.2.1 C24x

16-разрядный.

3 режима энергосбережения.

Совместимость выводов.

JTAG эмуляция.

3.3-V и 5-V питание.

Обладая производительностью до 40 MIPS, 16-битные контроллеры семейства C24x™ позволяют реализовывать различные алгоритмы управления. Набор однотактовых инструкций обеспечивает быстрое выполнение сложных математических вычислений в режиме реального времени, а гарвардская архитектура имеет ряд удобств при использовании векторной математики, часто используемой в задачах промышленной автоматизации. Модернизированная гарвардская архитектура контроллеров C24x обеспечивает максимальную скорость обработки данных благодаря наличию раздельных шин для программы и данных, позволяя одновременно читать данные и программные инструкции. Передача данных между двумя пространствами поддерживается программно.

Высокопроизводительная организация памяти. Архитектура памяти контроллеров семейства C24x позволяет загружать коэффициенты из программной памяти непосредственно в ОЗУ, исключая необходимость в дополнительном ПЗУ для коэффициентов. Эта особенность, совместно с 4-уровневым конвейером, позволяет контроллерам семейства C24x выполнять большинство инструкций за один цикл.

Особенность DRAM-памяти, позволяющей осуществить две операции за один цикл, совмещённая с параллельной архитектурой обеспечивает контроллерам C24x возможность выполнять три одновременных операции с памятью за один машинный цикл.

Представители семейства C24x обладают различным набором встроенных типов памяти, включающих однопортовое ОЗУ, ПЗУ и Flash-память. Все представители семейства изготавливаются по субмикронной комплементарной КМОП-технологии с пятью металлизациями.

Page 129: Современные проблемы информатики и вычислительной техники

129 `

Периферийные устройства. Платформа C2000.™ обладает высокой степенью интеграции периферийных устройств, свойственной микроконтроллерам и используемой для обработки смешанных сигналов, с высокой производительностью ядра цифрового сигнального процессора (DSP), встроенной перепрограммируемой flash-памятью, прецизионными аналоговыми, цифровыми и коммуникационными периферийными устройствами. Такой уровень интеграции упрощает разработки и удешевляет их, позволяя реализовывать однокристальные решения.

Flash-память. Модуль Flash-памяти с варьируемым объёмом от 16 to 256КБ позволяет разработчику многократно изменять программу в контроллере, в том числе и непосредственно в готовом изделии. Возможность перепрограммирования Flash-памяти обеспечивает максимальную лёгкость и удобство обновления программных версий приборов.

Flash-память контроллеров семейства C2000.™ разбита на секторы, что позволяет пользователю программировать лишь часть памяти, не осуществляя предварительного полного стирания. Кроме этого, контроллеры семейства C2000.™ обладают уникальной возможностью защиты кода 32-х или 64-битным паролем.

АЦП. Разрешение 10 бит (семейство C24x) и 12 бит (семейство C28x)

Модуль CAN. Полнофункциональный контроллер CAN-интерфейса.

Последовательный интерфейс связи (SCI-UART). Обеспечивает асинхронный формат связи, дуплексный и полудуплексный режим, раздельные прерывания на приём и передачу

Последовательный периферийный интерфейс (SPI). Высокоскоростной 16-битный программируемый последовательный интерфейс (1-8 бит в устройствах семейства F/C240). Поддержка мультипроцессорного обмена данными.

Многоканальный буферизованный последовательный порт (McBSP). Полнодуплексная связь. Двойная буферизация на передачу и тройная на приём позволяет организовать непрерывный обмен данными. 128 каналов приёма и передачи

Интерфейс IIC (I2C). Полная совместимость со спецификацией шины I2C фирмы Philips Semiconductors (версия 2.1). Поддержка форматов передачи от 1 до 8 бит. Режим адресации от 7 до 10 бит.

9.2.2.2 C28x с ФТ

32-bit C28x™ ядро.

12-разрядный АЦП.

6: канальный прямой доступ к памяти.

Интерфейсы управления энергопотреблением.

Page 130: Современные проблемы информатики и вычислительной техники

130 `

32-битные МК семейства C28x™ объединяют в себе мощные и эффективные технологии ЦОС фирмы TI с богатым набором периферийных устройств и простотой использования на уровне МК. Архитектура МК семейства C28x позволяет выполнять за один цикл операции типа 32x32 MAC либо 2 операции типа 16x16 MAC, превосходя по этому параметру любые другие аналоги с ФТ. Ядро содержит сверхбыстрый модуль управления прерываниями, что позволяет значительно снизить задержки при входе в прерывание.

МК семейства C28x обладают рядом уникальных возможностей, например, таких, как операции Чтение-Модификация-Запись за один цикл по любому из адресов памяти, что позволяет значительно повысить производительность и эффективность кода, многие другие инструкции также являются атомарными.

Ядро МК семейства C28x оптимизировано для задач промышленной автоматизации, а разработанный параллельно с ним компилятор языка C позволяет добиться минимального удлинения кода по отношению к ассемблеру. Кроме этого, ядро МК семейства C28x поддерживает использование библиотеки "IQ-math", позволяя разработчику совмещать удобства использования математики ПТ с выгодной ценой платформы с ФТ.

МК C28x совмещают производительность 150 MIPS с преимуществами flash-технологии. Недорогие представители семейства F2808, F2806 и F2801 обеспечивают производительность в 100 MIPS. Все представители C28x изготавливаются по КМОП-технологии с 5 металлизациями. На программном уровне МК семейства C28x совместимы с популярной серией МК C24x™.

9.2.2.3 Piccolo

32-разрядные МК F2802x/2803x/2806x Свойства:

32-разрядное ядро C28x с вычислениями с ФТ или ПТ.

Рабочие частоты 40-80 МГц.

Питающее напряжение 3,3 В.

Удобные ПО и средства разработки, сокращающие время вывода на рынок.

Page 131: Современные проблемы информатики и вычислительной техники

131 `

F2802x – это МК с ФТ, рабочей частотой 40-60 МГц, встроенной флэш-памятью до 64 КБ, смонтированные в компактном 38-выводном корпусе, поддерживают большой набор периферийных устройств, среди которых 150-пс улучшенные широтно-импульсные модуляторы высокого разрешения, 12-разрядные АЦП производительностью 4,6 MSPS, высокоточные интегрированные генераторы, аналоговые компараторы и интерфейсы I2C, SPI и SCI.

F2803x – это 32-разрядные МК с рабочей частотой 60 МГц, с флэш-памятью до 128 КБ, смонтированные в 64- или 80-выводном корпусе. Устройства F2803x поддерживают все те же периферийные устройств, что и серия 2802x, а также встроенный ускоритель алгоритмов управления (CLA), повышающий эффективность контуров управления, модуль QEP и интерфейсы CAN и LIN.

F2806x - добавляют в серию МК Piccolo вычисления с ПТ, а также в них становится больше памяти, больше периферийных устройств и новых технологий управления в реальном времени. Устройства F2806x удваивают количество памяти в семействе F2803x — до 256 КБ флэш-памяти и 100 КБ оперативной памяти. Производительность увеличена до 80 МГц, а встроенный ускоритель алгоритмов управления (CLA) предоставляет дополнительные вычислительные мощности, так же как и новый математический сопроцессор (модуль Viterbi, Complex Math, CRC) для выполнения сложных математических операций. Последовательные линии передачи данных также расширены благодаря большему количеству интерфейсов.

Области применения Piccolo:

Цифровое управление электроприводом,

цифровое управление питанием,

возобновляемые источники энергии,

передача данных по линиям электропередач,

освещение и усовершенствованные датчики для автомобилестроительного медицинского и потребительского рынков.

Блок-схема:

Page 132: Современные проблемы информатики и вычислительной техники

132 `

9.2.2.4 Concerto

Concerto совмещает возможности подключения и управления, объединяя в одном устройстве ядро ARM Cortex-M3™ и ядро C28x. Благодаря Concerto, такие устройства, как инверторы солнечных батарей и промышленные системы управления, сохраняют преимущества раздельного управления и коммуникации, оставаясь однокристальным решением.

Кроме того, Concerto позволяет сертифицировать безопасность вашей системы при помощи функций защиты и усовершенствованного оборудования.

Блок-схема F28M35x – Первая серия в семействе МК Concerto™.

Page 133: Современные проблемы информатики и вычислительной техники

133 `

Основные особенности

Ядро C28x (до 150 МГц) оптимизировано для следующих областей применения:

Управление в масштабе реального времени (более 15 лет, наследование DSP).

Датчики, фильтрация и ЦОС.

PLM-решения с программируемым микрокодом (VCU).

Цифровое независимое многоконтурное управление питанием.

Управление электроприводом и мониторинг питания.

9.2.2.5 Delphino

Серия продуктов с поддержкой вычислений с ПТ – 32-разрядный 283x Delfino™

32-разрядное ядро C28x™ с поддержкой вычислений с ПТ.

Производительность 600 MFLOPS при частоте до 300 МГц.

6-канальный DMA.

Мощные и гибкие интерфейсы управления

Области применения F283xx:

Сервоприводы и управление двигателями,

Page 134: Современные проблемы информатики и вычислительной техники

134 `

расширенный мониторинг линий электропередач,

возобновляемые источники энергии,

системы предупреждения водителя.

9.2.3 Stellaris

МК Stellaris® - 32-битные приборы, построенные на ядре ARM® Cortex™-M3. Данные МК совместно с программным обеспечением, инструментами для разработки приложений и накопленной “базой знаний” по их применению, представляют собой весьма обширную и популярную среди разработчиков экосистему. Основные свойства:

одно из лучших ядро ARM Cortex-M3,

от 8 до 512 кБ флэш-памяти,

тактовая частота от 20 до 80 МГц,

детерминированная обработка прерываний (12 циклов),

многозадачность в реальном времени,

интегрированные аналоговые интерфейсы,

Page 135: Современные проблемы информатики и вычислительной техники

135 `

10-битный АЦП,

ШИМ-модулятор с программируемыми строб-таймерами,

3 энергосберегающих режима работы со стробированием работы тактовых генераторов.

Уникальные особенности:

широкий набор коммуникационных интерфейсов: 10/100 Ethernet MAC/PHY, USB OTG, контроллеры CAN, I2C, I2S,

порты ввода/вывода с программируемой нагрузочной способностью,

1-цикловая флэш-память с тактовой частотой до 50 МГц,

бесплатное ПО StellarisWare®,

МК Stellaris и ARM Cortex-M3 открывают кратчайший путь в мощнейшую в отрасли экосистему средств разработки, программного обеспечения и знаний.

Page 136: Современные проблемы информатики и вычислительной техники

136 `

9.2.4 TMS570

МК TMS570 - прибор повышенной надёжности для автотранспорта.

Приборы содержат значительный для приборов своего класса объём памяти типов флэш и RAM, специализированное ядро TMS570 ARM® Cortex™-R4F с производительностью не менее 250 DMIPS, содержат модуль вычислений с плавающей точкой IEEE, оснащены широким набором периферийных устройств, таких как CAN и FlexRay, модулем сопроцессора HET и 12-битным АЦП.

Аппаратный функционал повышенной надёжности реализован особой схемой включения 2 независимых вычислительных ядер, широкой аппаратной поддержкой функций BIST, ECC, контроля чётности, и ряда других. Всё это делает данный контроллер оптимальным для создания приборов, к функционированию которых предъявляются требования высшей надёжности.

Такие основные функции прибора, как цепи питания, тактовые генераторы, аппаратный рестарт и другие, содержат дополнительные цепи и модули защиты и самодиагностики на аппаратном уровне.

Основные свойства:

встроенные логические цепи мониторинга напряжения питания.

Page 137: Современные проблемы информатики и вычислительной техники

137 `

встроенные логические цепи мониторинга и самодиагностики тактовых генераторов и цепей PLL, а также резервный RC-генератор, используемый в случае сбоя основного.

Включение 2 вычислительных ядер, позволяющее ядрам взаимную диагностику возможных сбоев в каждом такте их совместной работы.

Аппаратные контроллеры BIST предоставляют высочайший уровень диагностирования как обоих ядер, так и памяти SRAM; всё это работает значительно быстрее и потребляет намного меньше ресурсов, чем программные решения с подобным функционалом.

Функции контроля ECC в памяти SRAM и флэш интегрированы в самом процессоре.

Уникальные особенности:

Непрерывный контроль чётности во всех типах памяти.

Цепи аналоговой и цифровой обратной связи для диагностики отключенных или короткозамкнутых цепей ввода и вывода.

Функции аппаратной самодиагностики в модуле АЦП контролируют состояние как аналоговых входов, так и самой функции преобразования.

Основные области применения:

тормозные системы (ABS и ESC);

усилитель рулевого управления (EPS);

системы инверторов HEV/EV;

системы мониторинга аккумуляторной батареи;

аэрокосмические приборы;

железнодорожная аппаратура;

аппаратура для внедорожных автомобилей

9.2.5 Hercules

Платформа защищенных продуктов серии Hercules Включвет в себя 3 семейства МК на основе ARM® Cortex™: TMS470M, TMS570 и RM4x. Разработанная специально для задач с особыми требованиями к безопасности IEC 61508 и ISO 26262, платформа Hercules имеет расширенный набор встроенных функций обеспечения безопасности, обладая при этом масштабируемой производительностью, средствами связи и вариантами комплектации памяти.

Области применения продуктов серии Hercules:

Промышленная автоматика.

Управление электродвигателями и приводами.

Медицинское оборудование.

Автомобильная электроника и транспорт.

Космос, авионика и оборона.

Page 138: Современные проблемы информатики и вычислительной техники

138 `

9.3 МК от Microchip

Компания Microchip Technology на сегодняшний день входит в тройку крупнейших поставщиков МК и DSC вместе с TI и Freescale (по состоянию на середину 2007г.).

В МК нет аппаратной поддержки операций умножения и деления (как в DSC). Имеется только АЛУ.

PIC МК находят свой путь в новые приложения, такие как детекторы дыма, зарядные устройства, светодиодные фонари и передовые медицинские устройства. Компания предоставляет решения для всего диапазона применения 8-битных МК с легкими в использовании инструментами разработки, полный комплект технической документации и поддержкой.

Page 139: Современные проблемы информатики и вычислительной техники

139 `

Повышена эффективность 1-цикловых инструкций.

Доступна перепрограммируемая память EEPROM.

Унифицированы инструменты для всех ядер.

Команды и данные на разных шинах.

Одновременный доступ к шинам данных и команд.

Шина памяти программ имеет ширину 12, 14 и 16 бит.

В этих МК нет аппаратной поддержки операций умножения и деления. Имеется только АЛУ.

Page 140: Современные проблемы информатики и вычислительной техники

140 `

9.3.1 8-битные МК

9.3.2 Базовый PIC МК

Базовый PIC МК 8-разрядный, его предпочитают инженеры в мире для широкого спектра приложений. Базовые PIC МК используют 12-битную программу word и обеспечивают нужное количество функций и опций для сведения к минимуму расходов и получить работу правильно.

Простые 33 инструкции (12-битные) для удобства использования и быстрой разработки.

Адресуемая программная память (до 3 KB).

Память данных до 144 байт.

2 уровневый аппаратный стек.

1 файл регистров (8-бит).

Несколько опций продукта и легкая миграция.

Минимальное число доступных форм-факторов.

Специальные функции:

прецизионный внутренний генератор 4MHz с точностью ±1%,

внутрисхемное программирование (ICSP),

внутрисхемная отладка (ICD),

включение после сброса (POR),

таймер системного сброса (DRT),

сторожевой таймер (WDT) со встроенным RC-генератором,

защита программного кода,

мультиплексированный вход MCLR,

внутренние подтягивающие резисторы на I/O-выводах,

режим «сна»,

запуск из режима «сна» при смене состояния на входах.

Периферия:

4 вывода I/O-линий: 3 вывода I/O-линий с индивидуальным контролем направленности, 1 вывод работает только как выход, большой втекающий и вытекающий ток I/O-линий для прямого управления внешними

светодиодами.

Page 141: Современные проблемы информатики и вычислительной техники

141 `

8-разрядный таймер/счётчик реального времени (TMR0) с 8-разрядным программируемым делителем

компаратор (PIC10F204/206): внутренний источник опорного напряжения, доступ извне к обоим входам и выходу компаратора

Экономичная CMOS-технология:

ток потребления в рабочем режиме не более 350uA при 2V, 4MHz,

ток потребления в режиме останова: 100nA при 2V,

Flash-память программ: 256byte (PIC10F200/204) и 512byte (PIC10F202/206),

память данных: 16byte (PIC10F200/204) и 24byte (PIC10F202/206),

гарантируемое число циклов перезаписи Flash-памяти – 100000, хранение данных более 40 лет,

полностью статическая структура,

широкий диапазон напряжения питания: 2.0V…5.5V.

МК производятся в корпусах DIP-8, SOT23–6 и DFN-8 для температурных диапазонов −40°C…+85°C и −40°C…+125°C.

Page 142: Современные проблемы информатики и вычислительной техники

142 `

Набор инструкций.

Page 143: Современные проблемы информатики и вычислительной техники

143 `

9.3.3 Среднего уровня PIC МК

Эти МК имеют следующий уровень производительности и функций. Используют инструкции с 14-битным словом. Эти устройства с богатой периферией идеальны для многомерных приложений, требующих более высокого уровня встроенного элемента управления.

35 простых инструкций (14-битных).

Адресная программная память (до 14 KB).

Память данных до 46 байт.

8 уровневый аппаратный стек.

1 файл регистров (9-бит).

Аппаратное прерывание.

Расширенный набор функций для систем связи и управления двигателем.

9.3.4 Расширение среднего уровня PIC МК

Компания продолжает инвестировать в своей 8-разрядный МК PIC линии, чтобы предоставлять широкий ассортимент, который удовлетворяет потребности существующих и будущих клиентов. Новое расширение ядро опирается на лучшие элементы среднего ядра и обеспечивает дополнительную производительность, при сохранении совместимости.

Page 144: Современные проблемы информатики и вычислительной техники

144 `

49 простых инструкций (14-битных).

Адресуемая программная память (до 56 KB).

Память данных до 4 Кбайт.

16 уровневый аппаратный стек.

2 файла регистров (16-бит).

Аппаратное прерывание с сохранением содержимого.

Расширенный набор функций для систем связи и управления двигателем.

Новые 28-контактные МК предлагают комбинацию усовершенствованных цифровых и аналоговых периферийных устройств, наряду с ультранизким энергопотреблением, для расширенного времени работы от батарей, что требуют многие из применений. Данные решения делают МК PIC16F1512/13 хорошо подходящими для широкого диапазона применений: в устройствах, медицинских, потребительских, автомобильных разработках, и многих других.

Цена и доступность.

МК PIC16F1512 и PIC16F1513 в данный момент доступны в виде образцов и в серийных количествах, и выполнены в 28-контактных корпусах SSOP, SOIC, SPDIP и корпусе UQFN, размером 4 x 4 x 0.5-мм. Цены начинаются от 0,58$ для объёмных поставок.

9.3.5 PIC18 МК

Семейство PIC18 комбинирует максимальный уровень производительности и интеграции с легкостью использования 8-битной архитектуры. С 16 MIPS вычислительной мощности МК PIC18 включают дополнительные периферийные устройства, такие как USB, Ethernet, LCD и CTMU. Спроектирован для приложений, чувствительных к высокой плотности памяти, стоимости.

Page 145: Современные проблемы информатики и вычислительной техники

145 `

Provides the highest performance with benchmark nanoWatt XLP extreme low power consumption.

83 инструкции (16-битные) с С-оптимизацией.

Адресуемая программная память (до 2 МB).

Память данных до 4 Кбайт.

16 уровневый аппаратный стек.

3 файла регистров (8-бит).

Высокая производительность с 8-битной архитектурой

9.3.6 PIC24F с низким энергопотреблением

PIC24F МК возможности экономически эффективны.. PIC24F включает USB-OTG, чтобы действовать в качестве устройства USB или хоста, и встроенный графический контроллер для реализации графического отображения интерфейса.

Page 146: Современные проблемы информатики и вычислительной техники

146 `

Скорость до 16 MIPS при питании 3.3 В. Ток в режиме сна 20 нА Напряжение источника питания 2…3,6 В. Интегрированная периферия для управления двигателем, USB. 1 (8-бит) регистровый файл. Несколько опций продукта и легкая миграция. Минимальное число доступных форм-факторов.

9.3.7 16-битные МК

9.3.7.1 PIC24F: экономичные МК

PIC24F МК сочетает экономическую эффективность с технологией экстремально низкого энергопотребления. PIC24F включает:

USB-OTG, чтобы действовать в качестве устройства USB или хоста,

модуль управления временем заряда, что позволяет делать точные измерения времени для mTouch приложения,

встроенный графический контроллер для реализации графического отображения интерфейса.

9.3.7.2 PIC24H/E: высоко эффективные МК

Семейство МК общего назначения PIC24H/E отличается высокой производительностью и отличной плотностью кода. PIC24H/E предлагают CAN связи, интегрированный операционный усилитель и управление двигателем, АЦП с улучшенной производительностью, USB-OTG, легкий интерфейс с графическим дисплеем через 8-битный параллельный главный порт и обширные данные о движениях через каналы DMA. PIC24H/E устройства доступны в небольших корпусах (вплоть до 5x5 мм) с масштабируемой памятью (до 536КБ) и увеличением максимальной температуры (125°C или 150°C).

Page 147: Современные проблемы информатики и вычислительной техники

147 `

Скорость до 70 MIPS при питании 3.3 В. Быстрый прямой доступ к памяти без зацикливания. 1-цикловое исключение и быстрое прерывание (5 циклов). Интегрированный операционный усилитель. Управление двигателем. Высокоэффективный 12-битный АЦП и CAN. Графика. Широкий диапазон опций и пакетов.

10 Современные DSP

10.1 DSP от Texas Instruments

10.1.1 Одноядерные DSP

10.1.1.1 С ядром ARM

Созданная компанией TI сеть компаний TI Developer Network - глобальное сообщество компаний, разрабатывающих решения на процессорах компании и предлагающих накопленные знания и опыт работы в данной области всем, для кого важно ускорение цикла разработки - создания прототипа - выхода на рынок.

Сеть включает компании, занимающиеся:

системной интеграцией, консультированием, разработкой электроники.

разработкой и применением операционных систем высокого уровня и реального времени, кодеков, графических функций и интерфейсов.

разработкой и производством аппаратного и программного обеспечения для инженеров-разработчиков.

Компания TI поддерживает сообщество партнёров открытым доступом к своим аппаратным и программным решениям, что позволяет им предлагать продукты, полностью совместимые с продуктами TI. Ниже приводится список компаний, с которыми компания TI сотрудничает в области применения МП Sitara.

Page 148: Современные проблемы информатики и вычислительной техники

148 `

Для удовлетворения потребностей рынка в производительных, экономичных и экономически эффективных решениях, компания TI значительно расширила ассортимент встраиваемых процессоров на базе технологии ARM.

Высокопроизводительные DSP SitaraTM и проверенные практикой МК Stellaris® составляют основную массу ARM-продуктов компании. Среди других известных и популярных среди разработчиков устройств стоит упомянуть также о специализированных процессорах для мобильных приложений OMAP, мультимедийных процессорах DaVinciTM, а также о семействе IntegraTM (DSP+ARM).

Широкий ассортимент устройств с различными типами ядер (ARM Cortex™-M3, Cortex-R4, ARM9™, Cortex-A8), предлагает масштабируемость решений как по производительности, так и по уровню интеграции периферийных

10.1.1.2 SitaraTM

DSP семейства Sitara построены на ядрах CortexTM-A8 и ARM9TM, их тактовые частоты находятся в диапазоне от 300 МГц до 1,5 ГГц.

Используя возможности технологии ARM, а также встроенного набора стандартных периферийных модулей, семейство позволяет разработчикам создавать решения с легко переносимым кодом как внутри семейства процессоров, так и в пределах всего ассортимента ARM-продуктов компании TI. Семейство содержит широкий набор устройств, различающихся тактовой частотой, наличием акселератора 3D-графики, вариантами корпусов, диапазоном рабочих температур. Всё это позволяет разработчикам выбрать прибор, оптимально подходящий по необходимым параметрам, стоимости и энергопотреблению.

Компания TI предоставляет также значительное количество недорогих инструментов для разработки, а также операционные системы AndroidTM, LinuxTM, Windows® Embedded CE в качестве возможной базы для Ваших устройств, что позволяет ускорить разработку как аппаратной, так и программной части нового устройства. Дополнительные услуги доступны через широкую сеть партнёрских компаний.

Отладочные модули (EVM), содержащие полный набор аппаратных и программных средств, и документации, доступны для приобретения у самой компании; немало бюджетных плат и инструментов разрабатывается и поставляется также независимыми поставщиками.

Page 149: Современные проблемы информатики и вычислительной техники

149 `

Основные свойства ARM-процессоров семейства Sitara:

Cortex и ARM9 - решения могут быть легко портированы на программно-совместимые приборы Integra™ и DaVinci™.

Интеграция основных периферийных устройств

Программируемый модуль реального времени для обеспечения работы с дополнительными периферийными устройствами

Мощные опции работы с графикой (в том числе и 3D)

Оптимизация для низкого энергопотребления

Бесплатные для использования порты ОС Android, Linux и Windows CE.

10.1.1.3 Ядро ARM9

10.1.1.4 Ядро Cortex-A8

МП AM3894 и AM3892 - основные свойства:

Два 32-битных порта RAM DDR2/DDR3 - скорость до 1600 Мб/с.

Две полосы PCI второго поколения - до 5 Гб/с.

Два порта (MAC) гигабитного Ethernet - по 1 Гб/с.

Интегрированный интерфейс SATA-2 - для 2-х дисков.

Поддержка нескольких графических дисплеев (разрешение до 1920х1280).

МП AM389х - уникальные свойства:

Самое высокопроизводительное ядро ARM Cortex-A8 (частота до 1,5 ГГц).

Интеграция высокоскоростных периферийных устройств.

Области применения:

Сетевые коммуникации.

Page 150: Современные проблемы информатики и вычислительной техники

150 `

“Одноплатные” компьютеры.

Интерактивные киоски

Page 151: Современные проблемы информатики и вычислительной техники

151 `

10.1.1.5 С5x

Платформа включает DSP с ультранизким энергопотреблением в дежурном (standby) режиме. Включает средства автоматического управления режимами, хороша для портативных устройств типа цифровых медиа проигрывателей, VOIP, GPS приемников, медицинских аппаратов.

Насколько низкой может быть цена? Компания TI преодолела ценовой барьер в 2 доллара за DSP!

4 устройства — C5532, C5533, C5534 и C5535 с тактовыми частотами 50 и 100 МГц обеспечивают реализацию сложных математических алгоритмов и решений для работы высокой точностью вычислений при низкой стоимости и очень малом энергопотреблении

DSP с самым низким в отрасли энергопотреблением: полное энергопотребление ядра в активном режиме составляет менее 0,15 мВт/МГц при 1,05 В, а энергопотребление в режиме ожидания – менее 0,15 мВт, что в 6 раз ниже, чем у аналогичной продукции ближайших конкурентов

Корпус BGA толщиной 0,8 мм допускает использование 4-слойной печатной платы, что уменьшает общую стоимость системы

Интегрированная высокоскоростная периферия: USB 2.0 с PHY, SD/eMMC, I2S, UART, SPI, GPIO

Различные варианты объема встроенной памяти от 64 КБ до 320 КБ для обеспечения масштабируемости в соответствии с потребностями конкретной задачи

Программируемый сопроцессор с поддержкой БПФ, до 1024 точек

Контроллер ЖК-дисплея и 10-битный 4-канальный АЦП последовательного приближения для реализации интуитивно понятных интерфейсов

1-3 регулятора с малым падением напряжения (LDO) для встроенного управления питанием

Новые DSP-процессоры C5514/15 расширяют платформу 16-битных DSP с самым малым в отрасли потреблением, обеспечивая прирост производительности на 20%.

Отличаясь рабочей частотой до 120 МГц и высокой интеграцией периферии, новые малопотребляющие DSP C5514 и C5515 позволяют пользователю сохранить чрезвычайно низкий уровень энергопотребления, увеличив при этом функциональные возможности конечного устройства.

Основные особенности и преимущества DSP C5514:

3 стабилизатора – по одному для питания ядра DSP, модуля USB и аналоговой подсистемы.

Page 152: Современные проблемы информатики и вычислительной техники

152 `

Высокий уровень интеграции периферии, включая интерфейсы высокоскоростного USB 2.0, I2S, UART, SPI, MMC/SD и линии ввода-вывода общего назначения, снижает стоимость системы и позволяет реализовать более дружественный интерфейс пользователя в портативных устройствах.

До 256 Кбайт внутренней памяти снижает стоимость и энергопотребление системы, позволяя отказаться от внешней памяти.

Динамическое изменение напряжения и частоты позволяет увеличить время работы батареи в портативных устройствах.

Масштабируемость и совместимость по выводам всех 4 процессоров (C5504, C5505, C5514, C5515) дает большую свободу пользователю.

DSP C5515 включает все особенности C5514 и дополнен:

Дополнительной внутренней памятью 64 Кбайт (всего 320 Кбайт).

Программируемым аппаратным ускорителем БПФ, до 1024 точек.

Интегрированным контроллером ЖК-дисплея и 10-битным 4-канальным АЦП последовательного приближения возможностью снизить стоимость системы и реализовать более дружественный интерфейс пользователя в портативных устройствах

Структура.

3 шины данных используются для чтения операндов и записи результата операции одновременно с выборкой инструкции в одном процессорном цикле. Общий объем адресуемой процессором памяти, составляющий 192 16-разрядных слов, разбит на 3 специализированных сегмента: команд, данных и ввода/вывода ― каждый из которых может иметь размер до 64 Кслов. Внутри DSP может быть ПЗУ объемом до 48 16-разрядных и до 10 Кслов двухвходового ОЗУ.

Page 153: Современные проблемы информатики и вычислительной техники

153 `

Для ускорения выполнения типовых операций ЦОС помимо «стандартных» блоков барабанного сдвига и адресной арифметики DSP содержит ряд дополнительных функциональных модулей, повышающих его гибкость и производительность.

Блок умножения с накоплением (MAC) выполняет над 17 битовыми операндами операции за один процессорный такт. Подобные операции характерны для алгоритмов фильтрации, свертки, вычисления корреляционной функции.

АЛУ способно выполнять арифметические или булевы операции над комплексными числами (используя два регистра-аккумулятора — АССА и АССВ) или может функционировать как два 16-разрядных АЛУ, выполняющих одновременно две 16-разрядных операции. АЛУ и MAC могут выполнять операции в цикле одновременно.

Устройство циркулярного сдвига осуществляет сдвиг данных на 0—31разряд влево или 0—16 разрядов вправо за один такт. Дополнительные возможности сдвига позволяют процессору масштабировать данные, выделять разряды числа, предотвращать возникновение переполнения и потери значимости.

Все DSP C54x имеют одинаковую структуру, однако отличаются друг от друга расположенной на кристалле периферией. В состав периферии входят:

программно-управляемый генератор тактов ожидания;

программный переключатель банков памяти;

параллельные порты ввода/вывода;

аппаратный таймер и генератор тактовых импульсов.

Генератор тактов ожидания позволяет увеличить число тактов внешней шины для работы с медленной внешней памятью и внешними устройствами.

Переключатель банков памяти позволяет автоматически добавлять один такт при пересечении границ банка памяти внутри программного адресного пространства. Этот дополнительный такт позволяет устройству памяти освободить шину раньше, чем другое устройство получит доступ к ней, избегая тем самым конфликтной ситуации при обращении к памяти.

64К портов ввода/вывода. Эти порты предназначены для связи с внешними устройствами с использованием минимума дополнительных внешних декодирующих схем.

Интерфейс главного порта (хост-интерфейс) - 8-разрядный параллельный порт, предназначенный для связи DSP и хост-процессора системы.

Дуплексные последовательные порты позволяют с высокой скоростью связываться с другими процессорами, кодеками и т.д. В DSP реализованы следующие разновидности последовательных портов:

Универсальный последовательный порт. Он использует два отображаемых в память регистра: передачи данных и приема данных. Передача и прием данных сопровождается генерацией маскируемого прерывания, которое может быть обработано программно.

Мультиплексный последовательный порт с уплотнением по времени.

Буферизированный последовательный порт позволяет осуществлять непосредственный обмен между устройством и памятью, не используя при этом ресурсов процессора. Максимальная скорость обмена по последовательному порту может составлять до 40 Мбайт/сек.

Как и в сериях C5x и C2xx, в DSP C54x реализована эффективная 3-уровневая система управления энергопотреблением. Низкое и управляемое энергопотребление, высокая производительность (до 66 MIPS) и широкие функциональные возможности при невысокой цене предопределили востребованность DSP в следующих областях:

сотовые и радиотелефоны,

персональные системы радиовызова, техника беспроводной передачи данных (радиосети) и т.д.

Page 154: Современные проблемы информатики и вычислительной техники

154 `

10.1.1.6 С6x

Серию С6x отличает большая производительность и стоимость. Высокая производительность достигается за счет внедрения параллельной архитектуры VelociTI, реализованной на основе технологии очень длинного командного слова VLIW (Very Long Instruction Word), а также за счет применения ряда других аппаратных решений и средств разработки.

По оценкам специалистов, применение данной архитектуры в будущем позволит, при сохранении совместимости по командам, достичь рубежей 8000 MIPS для DSP с ФТ и 3 GFLOPS для DSP с ПТ. Изготовляются и широко применяются следующие разновидности DSP серии C6000:

C62x – устройства с ФТ и производительностью от 1200 до 2400 MIPS.

C64x – устройства с ФТ и производительностью от 3200 до 4800 MIPS. Данные DSP являются наиболее скоростными.

C67x – устройства с ПТ и производительностью от 600 до 1350 MFLOPS.

C66x - поддерживают ФТ и ПТ.

Производительность DSP:

Семейство

Производительность

Тактовая частота МГц MIPS/MFLOPS MMAC (16 разрядные слова)

MMAC (8 разрядные слова)

C62x 150...300 1200...2400 MIPS 300...600 300...600

C64x 400...600 3200...4800 MIPS 1600...2400 3200...4800

C67x 100...225 600...1350 MFLOPS 200...550 200...550

При проектировании DSP серии C6000 особое внимание изготовителя уделялось снижению времени, которое понадобится пользователю для разработки и выпуска конечных систем. Сокращению этих сроков способствует свойство совместимости устройства с ФТ с соответствующим устройством с ПТ. DSP C67х имеют совместимость по командам и по выводам микросхем с DSP С62х, что позволяет разработчику быстро выполнять прототипы, используя плавающую точку, и легко переходить к DSP с ФТ для снижения стоимости изделия при производстве.

Вначале разработчик может взять за основу DSP с ПТ, отработать все элементы устройства, определить оптимальные алгоритмы обработки данных. При этом большие запасы по производительности и по точности вычислений позволяют заниматься именно алгоритмами, а не экономией ресурсов. После,

Page 155: Современные проблемы информатики и вычислительной техники

155 `

когда все параметры определены, наступает этап оптимизации системы с учетом наработанных решений и перенос ее на более дешевый DSP с ФТ.

Архитектура VelociTI

Все DSP С6000 основаны на одном и том же 32-разрядном ядре ЦП с высоко параллельной и детерминированной архитектурой VelociTI. Упрощенная схема ядра, без периферии и внешних шин, иллюстрирующая архитектуру VelociTI.

Архитектура ядра DSP С6000 включает 8 модулей - 2 умножителя и 6 АЛУ. Все модули максимально независимы, что дает компилятору и оптимизатору множество комбинаций их использования. На каждом такте DSP выбирается восемь 32-битных RISC-подобных инструкций. Предусмотренная в архитектуре VelociTI упаковка команд позволяет исполнять эти 8 инструкций параллельно, последовательно или параллельно/последовательно. Эта оптимизированная схема существенно снижает размер кода, количество выборок команд и потребление питания. При добавлении функции ПТ к 6 из 8 функциональных модулей из DSP с ФТ С62х получается DSP с ПТ – С67х. При этом система команд

Page 156: Современные проблемы информатики и вычислительной техники

156 `

С62х - расширение системы команд С67х и весь код написанный для С62х будет выполняться на С67х без модификаций самого кода.

Как видно из рисунка, DSP использует очень длинные инструкции (256 бит) для выдачи до 8 команд по 32 бита для каждого из 8 функциональных модулей в каждом такте. Выбираются инструкции всегда по 256 бит, однако длина исполняемого пакета может быть разной, как показано на рисунке. Переменная длина выполняемой команды позволяет существенно сэкономить память – это отличительная черта С6000 от остальных DSP с очень длинным командным словом.

Ядро DSP С6000 имеет 2 набора функциональных модулей. Каждый набор включает 4 модуля и регистровый файл. Каждый файл состоит из 16 32-разрядных регистров. Таким образом, всего в ядре 32 32-разрядных регистра.

2 набора функциональных модулей, связанных с 2 наборами регистров, создают разделение ядра на стороны А и В. 4 модуля с каждой стороны DSP имеют произвольный доступ к регистровому файлу данной стороны. Кроме того, каждая сторона имеет шину, соединенную с регистровым файлом другой стороны. При доступе к регистрам своей стороны возможен доступ к регистрам всех модулей одновременно в одном такте.

Другой особенностью архитектуры DSP С6000 является использование стратегии сохранения/загрузки, при которой все команды работают с регистрами. При этом два адресных модуля D1 и D2 выделяются только под передачу данных между регистровым файлом и памятью. Шины адреса, управляемые D-модулями, позволяют использовать адрес, сгенерированный в одном регистровом файле, для операций с данными в другом регистровом файле.

Ядро DSP С6000 поддерживает широкий набор режимов косвенной адресации, включая линейный или кольцевой с 5- или 15-битным смещением. Все команды могут быть условными, и большинство команд могут использовать любой из 32 регистров. Некоторые регистры могут быть выделены для поддержки специфических режимов адресации или для хранения условий для условных команд.

2 М-модуля выделены под умножители 16х16. 2 S- и 2 L-модуля выполняют арифметические, логические операции и операции перехода, и при этом результаты их выполнения доступны в каждом такте (возможна задержка до 5 тактов конвейера, но большинство команд выполняются за 1 такт).

Процесс обработки команды в ядре начинается после выборки 256- битовой инструкции из внутренней памяти команд, которая также может быть сконфигурирована как кэш-память команд. Далее каждая из 32-битных команд распределяется на свой модуль для исполнения. При этом у команд, выполняемых на разных модулях, проверяется младший бит. Он устанавливается в 1 для всех команд, которые должны выполняться одновременно. Команды, которые собраны для одновременного выполнения (до 8 команд), образуют пакет выполнения.

Ноль ставится в младшем бите команды, которая нарушает последовательность выполнения и откладывает команду на следующий пакет выполнения. Всего в выборке может быть до 8 пакетов выполнения. Очередной пакет размещается для выполнения в модулях в каждом такте. До окончания выполнения пакета следующий пакет выборки из памяти не выбирается. Эта «стратегия» позволяет существенно экономить память команд и менять режим работы программы от одновременного параллельного выполнения 8 команд на 8 модулях до практически последовательного выполнения команд, в зависимости от требований алгоритма.

Обратим внимание на организацию памяти данных. Как уже упоминалось, данные из функциональных модулей помещаются в регистры, а затем по адресам, генерируемым D-модулями, идет обмен с памятью данных. При этом каждый из регистровых файлов соединен 32 разрядными шинами с диспетчером памяти. Диспетчер организует одновременную выборку из памяти по 4 шинам до 64 разрядов по 2 подаваемым адресам. При этом память дробится на множество мелких банков, что практически исключает конфликты доступа к памяти. Такое решение обеспечивает доступ без задержек при параллельных потоках обращения и при возможности адресовать отдельно каждый байт памяти. Фактически вся память данных DSP организована не как двухпортовая, а как многопортовая, и количество одновременно выбираемых данных может меняться.

Page 157: Современные проблемы информатики и вычислительной техники

157 `

На рисунке показана внутренняя структура DSP С6x. DSP можно условно разделить на несколько частей:

Ядро процессора.

Области памяти данных и памяти команд.

Размещенная на кристалле периферия. Все эти части связаны между собой двумя контроллерами – памяти команд или кэш-памяти и памяти данных. Эти блоки связывают ядро DSP и банки памяти (с их специфической конфигурацией и доступом) с традиционными шинами, к которым подключаются периферийные модули и внешние устройства.

Рассмотрим подробнее периферийные устройства DSP С6000.

Контроллер ПДП. Устройство предназначено для передачи данных из памяти в память без участия центрального процессора. Контроллер ПДП имеет четыре основных программируемых и пять дополнительных каналов. Кроме того, контроллер ПДП используется при начальной загрузке программы в память DSP при старте (boot loader).

Хост «Порт-интерфейс» (ХПИ). ХПИ используется как для обмена данными с управляющим контроллером, так и для асинхронного обмена. ХПИ – это 16-разрядный параллельный порт, который обеспечивает прямой доступ к памяти DSP. При этом DSP является управляющим устройством для данного интерфейса, что существенно упрощает процедуру доступа. DSP может обмениваться информацией, как через внутреннюю, так и через внешнюю память. Кроме того, DSP может иметь прямой доступ к большинству устройств размещенной на кристалле периферии.

Шина расширения (ШР). ШР является расширением как ХПИ, так и ИВП (см. ниже). С использованием ШР можно реализовать 32-разрядный ХПИ, который будет работать аналогично штатному 16-

Page 158: Современные проблемы информатики и вычислительной техники

158 `

разрядному. ШР также может реализовать синхронный протокол обмена между хост DSP и ЦПУ, что дает возможность прямого подключения к большому набору стандартных шин хост DSP. Также к шине расширения могут быть подключено синхронное FIFO и асинхронные периферийные устройства.

Интерфейс внешней памяти (ИВП). ИВП это специальный блок, предназначенный для обмена данными с внешней памятью и быстродействующими внешними устройствами. ИВП может принимать запросы на обмен с внешней памятью от трех: контроллеров памяти данных, программной памяти-КЭШ и ПДП. Поскольку сам DSP – очень скоростное устройство, то ИВП не только выводит наружу классическую шину, но и имеет специальные сигналы для непосредственного подключения быстродействующего синхронного внешнего ОЗУ как динамического (SDRAM), так и статического (SBSRAM). Кроме того, к ИВП можно подключить и обычное статическое ОЗУ, ПЗУ, FIFO и другие устройства.

Начальный загрузчик. DSP C62x и C67x могут иметь множество режимов начальной загрузки, которые определяют, что именно будет делать DSP после сброса при подготовке к инициализации. Они могут включать загрузку программы с внешнего ПЗУ через ИВП или загрузку программы через ХПИ/ШР из внешнего устройства.

Многоканальный буферизованный последовательный порт МКБПП. Это последовательный скоростной порт, базирующийся на стандартном последовательном порте, как и в DSP других серий. Он имеет возможность читать и записывать данные в память без участия центрального процессора через контроллер ПДП. Кроме того, у него существуют многоканальные расширения, совместимые со стандартами El, Tl, SCSA и MVIP.

Отметим следующие функциональные возможности последовательного порта: полнодуплексная работа;

двойная буферизация данных (позволяет поддерживать непрерывность потока);

независимые тактовые частоты и схемы синхронизации для приема и передачи данных;,

прямое подключение микросхем аналоговых интерфейсов, микросхем

ЦАП и АЦП с последовательным интерфейсом.

МКБПП, по сравнению со стандартным последовательным портом, имеет дополнительные возможности:

прямое подключение к шинам;

многоканальный обмен при количестве каналов до 128;

переменный размер данных 8, 12, 16, 20, 24 и 32 бита;

встроенное u-Law и А-Law компандирование;

возможность передачи первым старшего или младшего разряда данных;

программируемая полярность сигналов синхронизации и тактовых сигналов данных;

гибкое программирование внутренних тактовых импульсов и синхронизации.

Таймер. DSP серии C6000 имеют два 32-разрядных таймера, которые могут быть использованы для:

задания временных событий;

реализации счетчиков;

генерации импульсов

прерывания DSP;

посылки синхроимпульсов в контроллер ПДП.

Селектор прерываний. Периферия DSP C6000 может иметь до 32-х источников прерываний. ЦПУ имеет возможность обрабатывать 12 прерываний. Селектор прерываний дает возможность выбора тех 12 прерываний, которые будут использоваться, и также дает возможность смены полярности внешних входов прерываний.

«Спящие» режимы. Логика снижения потребляемой мощности позволяет снимать тактовые сигналы с элементов DSP для снижения энергопотребления. Несмотря на свое предназначение для базовых станций, DSP C6000 также имеют режимы снижения энергопотребления. КМОП схемы в основном потребляют энергию в момент переключения, и чем выше частота работы, тем больше это потребление. При включении «спящих» режимов у DSP снимается тактовая частота сначала с ядра DSP, затем с

Page 159: Современные проблемы информатики и вычислительной техники

159 `

периферии, размещенной на кристалле, и последний «третий» режим снимает тактовую частоту практически со всего кристалла, в том числе и с блока умножения частоты. DSP имеет встроенный умножитель частоты с возможностью умножения внешней тактовой частоты на 2 и на 4, что делает возможным работу с низкой входной частотой и упрощает проектирование.

10.1.1.7 Расширенный DSP С6x

C6654 с ФТ и ПТ основан на TI KeyStone многоядерной архитектуре. C6654 использует 1 ядро CorePac C66x DSP, работает на 850 МГц. Это недорогое устройство с оптимизированным энергопотреблением, поддерживает высокую производительность обработки приложений, таких как медицинские изображения, тест и автоматизации.

C66x CorePac DSP полностью обратно совместим со всеми существующими устройствами в серии C6000 DSP с ФТ и ПТ.

На рисунке показана внутренняя структура DSP С6x. DSP можно условно разделить на несколько частей:

10.1.1.8 Средства разработки DSP C6x

Для разработчиков устройств на базе DSP серии TC6x предлагается широкий набор мощных средств разработки и отладки. Новая архитектура DSP данного семейства предполагает и новый подход к процессу разработки, который позволяют уменьшить время и стоимость создания проекта за счет переноса большей части работы на средства разработки. Разработчику остается написать алгоритм на языке высокого уровня, а его реализация и оптимизация с использованием всех преимуществ

Page 160: Современные проблемы информатики и вычислительной техники

160 `

архитектуры DSP перекладывается на компилятор. Это снимает одну из основных трудностей при работе на DSP с длинным командным словом – распараллеливание алгоритма. Такой подход имеет ряд преимуществ:

Существенно сокращается срок разработки и качество получаемого продукта за счет сосредоточения именно на реализуемой задаче, а не на средствах ее реализации.

Повышается качество и оптимальность кода за счет того, что автоматический оптимизатор всегда помнит все особенности архитектуры DSP и использует их по максимуму. Время разработки сокращается и за счет существенного уменьшения времени отладки из-за отсутствия ошибок в коде низкого уровня, которые часто возникают по вине разработчика (что-то забыл или не учел).

Процесс реализации алгоритма на DSP C6x протекает в несколько стадий. Вначале разработчик пишет алгоритм на языке Си или на ассемблере, и компилятор переводит его программу в машинный код с использованием всех возможностей DSP, таких как конвейерная обработка и интеллектуальное нахождение параллелизма в исходной программе для использования возможностей параллельной обработки команд в DSP. После наступает этап оценки производительности кода программными средствами, что позволяет оценить достигнутые результаты и провести оптимизацию кода без обращения к аппаратному обеспечению. И только следующим шагом идет проверка на макете устройства или отладочном модуле. Программные средства, предназначенные для разработки программ для DSP С6x:

С-компилятор, ассемблер и компоновщик.

Отладчик.

Среда Code Composer Studio.

Высокоуровневый С-компилятор, ассемблер и компоновщик. Данные программные продукты представляют собой набор средств для компиляции кода языка С. Они специально ориентированы на реализацию оптимальных программ, созданных по алгоритмам ЦОС. Имеет широкий набор встроенных средств оптимизации, как общего плана, так и специализированных для DSP С6000. Является ANSI совместимым компилятором. В состав данного продукта входит ассемблерный оптимизатор - средство для перевода последовательного ассемблерного кода в параллельный, специфичный для DSP С6000.

Отдадчик. Продукт позволяет производить проверку выполнения кода на персональном компьютере без DSP.

Code Composer Studio. Многомодульный программный продукт представляет собой мощную интегрированную отладочную среду для DSP C6000 и других серий. Имеет развитый оконный интерфейс, встроенные средства редактирования, возможность дизассемблирования и вызова внешнего компилятора, расширенные средства визуализации данных. По оценкам изготовителей среда Code Composer Studio станет стандартом и останется, чуть ли не единственным продуктом для программирования DSP компании TI Inc. по крайней мере, до 2020 года.

10.1.2 Многоядерные DSP

Семейство объединяет широкий спектр продуктов, обладающих высочайшей производительностью при исключительно низкой стоимости и уровне энергопотребления. Возможности платформы в области многоядерных вычислений и ее низкое энергопотребление оптимальны для выполнения задач в таких сегментах рынка как медицинские устройства обработки изображений, тестирование и автоматизация, особо ответственное оборудование, профессиональная обработка изображений и видео инфраструктура.

В число многоядерных DSP входит и новое расширенное поколение TI C66x, совмещающих как возможности вычислений с ФТ и ПТ, так и высокую производительность и низкое энергопотребление DSP семейства C647x.

Области применения многоядерных DSP:

Видео широковещание и инфраструктура.

Обработка изображений в вооруженных силах и авионике.

Вооружение – Радары/сонары.

Page 161: Современные проблемы информатики и вычислительной техники

161 `

Машинное зрение – Устройства захвата изображения.

Аппарат УЗИ - Портативный.

Магнитно-резонансная томография.

10.1.2.1 Многоядерные DSP C6x

В число многоядерных DSP входит и новое поколение устройств TI C66x, совмещающих как возможности вычислений с ФТ и ПТ, так и высокую производительность и низкое энергопотребление DSP семейства C647x.

Основные характеристики C6670:

4-ядра, 1,2 ГГц с усовершенствованными ускорителями для ориентированных на связь решений, в том числе программно управляемые радиосистемы (SDR), системы общественной безопасности и перспективные широкополосные радиосистемы.

Мульти стандартный сопроцессор цифрового потока (BCP), увеличивающий скорость передачи данных для LTE, WCDMA, TD-SCDMA и WiMAX.

Более сбалансированные программируемые ядра ЦП и настраиваемые ускорители, предлагающие упрощенную модель программирования SDR.

Простой в использовании, экономичный демонстрационный модуль C6670 помогает разработчикам начать работу с радио.

Page 162: Современные проблемы информатики и вычислительной техники

162 `

C6672 имеет 2 ядра C66, C6674 – 4, C6678 – 8..

Основные характеристики C6671:

Первый одноядерный продукт в семействе C66x, использует стратегический подход к конструированию для ознакомления разработчиков с многоядерными устройствами без требований к опыту работы с ними

Возможность выполнять действия с фиксированной и плавающей запятой на одном устройстве обеспечивает эталонную производительность и низкое энергопотребление

Возросшее количество периферийных устройств и объем памяти

Совместимость по выводам и по программному обеспечению с устройствами C6672, C6674 и C6678 упрощает разработку интегрированных, экономически эффективных продуктов с низким энергопотреблением для рынков высокопроизводительных устройств

10.1.2.2 KeyStone DSP + ARM

Многоядерные KeyStone DSP (ядро DSP + процессор ARM) включают широкий спектр выбора устройств, которые обеспечивают наивысшую производительность при низком энергопотреблении и стоимости. Платформа включает ARM с частотой до 5,6 ГГц и ядро DSP с частотой 9,6 ГГц. Она обеспечивает

Page 163: Современные проблемы информатики и вычислительной техники

163 `

обработку при более низком энергопотреблении, чем многокристальные решения, что делает ее оптимальной для встроенных приложений инфраструктуры, таких как «облачные вычисления», обработка медиа данных, высокопроизводительные вычисления, перекодирование, системы безопасности, игры, аналитика и виртуализация рабочего стола.

Архитектура KeyStone - первая платформа, совмещающая ядро ARM Cortex™-A15 и до 8 ядер C66x, обеспечивающее высокую производительность DSP.

Архитектура KeyStone, демонстрирующая поразительную производительность, является фундаментом, на котором разрабатываются новое поколение многоядерных устройств TI C66x. KeyStone отличается от всех прочих многоядерных архитектур, поскольку она способна обеспечивать полный комплект вычислительных функций на каждом ядре отдельно.

Предложение TI в области ПО упрощает разработчикам переход к многоядерности, Новое ПО TI C66x включает в себя:

MCSDK. Демонстрационные примеры, позволяющие покупателям значительно сократить срок разработки благодаря выбору кода, наилучшим образом подходящего для их задачи. MCSDK позволяет поддержать интеграцию SYS/BIOS и Linux с драйверами периферийных устройств. Также сюда включен четко определенный программный уровень для поддержки связи между ядрами и

Page 164: Современные проблемы информатики и вычислительной техники

164 `

между микросхемами. MCSDK доступен уже сейчас как для семейства TI C66x, так и для высокопроизводительных многоядерных устройств C64x+™.

Поддержка Linux. По мере того как разработчики переходят к использованию ПО с открытым исходным кодом в качестве ключевого элемента своего продукта, доступность Linux на C66x DSP сокращает объем разрабатываемого ПО, позволяя разработчикам сфокусироваться на дифференциации функций и ПО для решений на базе C66x и C64x+.

Оптимизированные библиотеки DSP (DSPLIB) и библиотеки для обработки изображений (IMGLIB) для комплекта команд архитектуры C66x содержат часто используемые оптимизированные ядра, обеспечивающие значительные преимущества при работе в самых разных областях применения, включая особо важные, тестирование и обработку изображений, анализ и распознавание изображений в контексте машинного зрения. TI планирует в течение года добавить новые усовершенствования в DSPLIB и IMGLIB, включая зрительный анализ, шифрование, голосовую и факсимильную связь.

Модель программирования OpenMP. Архитектура KeyStone – это первая архитектура DSP, поддерживающая модель программирования OpenMP. Эта модель позволяет разработчикам в процессе работы над своим продуктом запускать OpenMP-совместимый код на многоядерных DSP.

Программное обеспечение TI и обновления к нему доступны для бесплатной загрузки.

10.1.2.3 Integra DSP+ARM

Платформа гибридных (ARM + DSP) процессоров Integra включает в себя мощную высокопроизводительную линейку C6A816x и семейство бюджетных устройств OMAP-L1x. Процессоры Integra являются комбинацией ядер DSP и ARM. Процессоры данного семейства содержат DSP-ядрa oт высоко производительныx (поколения C6A806x) до бюджетных и экономичных ядер, используемых в процессорах OMAP-L1x. Процессоры данного семейства адресованы разработчикам, для которых важна высокая производительность при обработке сигналов в реальном времени, широкие возможности для работы с графикой, высокоскоростные интерфейсы и простота в разработке пользовательских приложений. Платформа поддерживается широким набором инструментов для облегчения и ускорения разработки.

Семейство процессоров Integra содержит самые высокопроизводительные DSP-ядра, доступные на рынке в настоящее время. В их состав входят также ядра ARM Cortex™-A8, работающие на тактовых частотах до 1,5 ГГц, высокопроизводительные интерфейсы, графические ускорители и контроллеры дисплеев отображения графики. Процессоры поддерживают операционные системы высокого уровня, предоставляющие богатый графический интерфейс и возможность отображения информации на нескольких дисплеях одновременно.

C6A816x Integra DSP+ARM - основные свойства:

DSP-ядра, поддерживающие вычисления с фиксированной и/или плавающей точкой, работающие на тактовых частотах до 1,5 ГГц.

Интеграция 2 ядер в одном кристалле позволяет повысить экономичность устройства, улучшить общую производительность системы, сэкономить на размерах и стоимости устройства

Интеграция широкополосных интерфейсов позволяют обеспечить высокоскоростную коммуникацию, в том числе и сетевую, при экономии на размерах и средствах.

Поддержка вывода информации на два дисплея и 3D-графики позволяет реализовать комплексные и графически богатые пользовательские интерфейсы.

Поддержка операционных систем высокого уровня.

Мощный аппаратный движок для отображения графики.

Основные области применения:

“Машинное зрение”, контроль промышленных процессов.

Аппаратура для измерений и тестирования.

Аппаратура для управления и трекинга.

Аппаратура для медицинской визуализации.

Page 165: Современные проблемы информатики и вычислительной техники

165 `

10.1.2.4 OMAP

Платформа OMAP была создана компанией TI специально для коммуникаторов и смартфонов. Это 2-ядерная платформа, где помимо основного ядра, работающего на частоте 200 МГц, добавлен специализированный DSP процессор для обработки мультимедиа (звука и видео), работы с GSM/GPRS/EDGE. Присутствует графический акселератор, аппаратное ускорение Java, реализованы интерфейсы беспроводной связи WiFi, Bluetooth, инфракрасного порта Fast IrDA, USB, карт памяти SD/MMC/SDIO, 2-х мегапиксельной камеры и т.д.

Семейство процессоров OMAP включает в себя устройства на базе ARM9 и ARM9+DSP. Приборы содержат широкий набор периферийных модулей и оптимизированы для работы под управлением ОС Linux. Продукты данного семейства также полностью совместимы по корпусам с новой серией продуктов C674x DSP. Потребление энергии у данных устройств находится в пределах от 8 милливатт (в режиме ожидания) до 400 милливатт при полной загрузке. Основные свойства:

позволяют интегрировать графические пользовательские интерфейсы в портативные приборы,

набор интегрированных интерфейсов облегчает создание приборов с продвинутыми сетевыми функциями,

потребление энергии: · сценарий deep-sleep - 12миватт, напряжения питания ядер - 1 В, ядро ARM® без нагрузки,

тактовые генераторы DSP и всех периферий отключены, режим PLL отключён, температура окружающего воздуха - 25°C.

· сценарий active - 480 милливатт, загрузка ядра DSP - 70%, тактовые частоты обоих ядер - 300МГц, напряжения питания - 1,2 В, ядро ARM® без внешней нагрузки со стороны

Page 166: Современные проблемы информатики и вычислительной техники

166 `

пользовательских приложений, обращения во внешнюю память mDDR 133МГц - 50% по общему времени, интерфейсы McBSP, SPI и GPIO активны, температура окружающего воздуха - 25°C

размеры корпусов - 13 х 13 мм, 16 х 16 мм, 17 х 17 мм.

OMAP уникальные особенности:

Общий размер внутренней памяти - до 448 кБ (в виде комбинации различных размеров памяти типа L1/L2 кэш и RAM).

Интерфейс для упрощения коммуникации с видео-входами и видео-выходами.

Универсальный параллельный порт.

Канал DMA с шириной до 64 бит с поддержкой режимов передачи данных 1-D, 2-D, 3-D.

Контроллер доступа к памяти NAND flash с 8- / 16-битным интерфейсом для команд, адресации и данных

Коммуникационные интерфейсы: порт host DMA, UARTs, McASP/McBSPs, SPI, I2C, контроллеры MMC/SD, интерфейсы USB 1.1/ 2.0, SATA, eCAP, eQEP.

контроллеры доступа к внешним банкам памяти типов: mDDR, DDR2, SDRAM, SRAM, Flash..

Основные области применения:

ПО для радио.

Портативная аппаратура для измерений и тестирования.

Портативные терминалы для доступа к базам данных.

Аппаратура для медицинской визуализации.

В линейке прикладных процессоров OMAP можно выделить два основных направления:

Прикладные процессоры для работы в приложениях беспроводной телефонии. К первому направлению относятся семейства OMAP1™, OMAP2™, OMAP3™ и OMAP4™. Ориентированность на приложения беспроводной связи определяется наличием средств поддержки.

Page 167: Современные проблемы информатики и вычислительной техники

167 `

Прикладные процессоры для портативных приложений, не связанных с телефонией. Ко второму направлению относятся семейства OMAP35x и OMAP-L1x.

OMAP35x. Устройства серии OMAP35x предназначены для использования в портативных навигационных устройствах, медиа проигрывателях, аппаратуре Интернета, индивидуальных медицинских приборах. Устройства серии OMAP35x используют две архитектуры: только ARM9 и ARM9+DSP. Они включают периферию для различных практических применений. Цена 22 – 42 $.

Вычислительной основой является ARM-ядро процессора Cortex™-A8 и ядро DSP с фиксированной точкой C64x+™. Последний используется в качестве видео- и графического акселератора.

Процессоры OMAP35x содержат подсистему управления ЖК-дисплеем, контроллер интерфейса цифровой камеры, а также мощную периферийную подсистему. В нее входят:

многоканальные буферизованные последовательные порты (McBSP),

четырехканальный контроллер интерфейса SPI,

3 контроллера интерфейса I2C,

3 универсальных асинхронных приемопередатчика (UART), один из которых предназначен для работы с инфракрасным каналом (IrDA).

Подключения к внешним интерфейсам представлены:

2 хост-контроллерами USB,

контроллером USB 2.0 HS OTG,

контроллером однопроводного интерфейса 1-Wire.

Помимо этого в состав периферии входят:

3 контроллера карт памяти MMC/SD,

12 универсальных таймеров и 2 сторожевых.

Производитель определяет такие области применения семейства OMAP35х™: портативные устройства (медиаплейеры, цифровые фото- и видеокамеры, PDA, игровые приставки), медицинская электроника, торговые и кассовые терминалы.

Page 168: Современные проблемы информатики и вычислительной техники

168 `

OMAP-L1. Семейство процессоров OMAP-L1x компании TI включает на данный момент 2 изделия: L137 и L138. Процессоры двухъядерные и содержат 32-разрядное универсальное ARM-ядро ARM926EJ-S и ядро цифрового сигнального процессора TMS320C674x.

Устройства серии OMAP-L1x используют архитектуру: ARM9+DSP. Они включают периферию для различных практических применений. Цена 16 – 18 $.

Рассмотрим более подробно составные части OMAP.

Подсистема ARM состоит из следующих составляющих:

32-разрядный RISC-процессор ARM926EJ-S с модулем управления памятью (MMU), работающий на частоте 300 МГц.

Кэш-память команд на 16 Кбайт.

Кэш-память данных на 16 Кбайт.

Внутренняя память ARM, в том числе: оперативная память 8 Кбайт (используемая как таблица векторов) и ПЗУ объемом 64 Кбайт (данные для начальной загрузки).

Встроенный буфер трассировки (ETB).

Процессор ARM926EJ-S ориентирован на применение в многозадачных приложениях, для которых существенное значение имеют эффективное управление памятью, высокая эффективность и малая потребляемая мощность.

Подсистема DSP включает в себя:

Процессорное ядро TMS320C674x, работающее на частоте 300 МГц.

Кэш-память программ L1P команд на 32 Кбайт.

Кэш-память данных L1D данных на 32 Кбайт.

Общую оперативную память программ и данных L2 объемом 256 Кбайт.

Постоянную память L2 программ на 1024 Кбайт.

Ядро C674x состоит из 8 функциональных блоков, 2 файлов регистров и 2 информационных каналов. 2 регистровых файла содержат по 32 32-разрядных регистра, то есть в общей сложности 64 регистра.

Page 169: Современные проблемы информатики и вычислительной техники

169 `

Регистры используются либо для хранения данных, либо для хранения указателей адреса данных. Поддерживаются следующие типы данных:

упакованные 8-разрядные данные,

упакованные 16-разрядные данные,

32-разрядные данные,

40-разрядные данные,

64-разрядные данные.

8 функциональных блоков (M1, L1, D1, S1, M2, L2, D2, и S2) могут выполнять одну команду за один тактовый цикл. Функциональные блоки M выполняют все операции умножения. Модули S и L выполняют общий набор арифметических и логических операций, а также функции перехода. Модули D загружают данные из памяти в регистровый файл и записывают результаты из регистрового файла в память. Каждая четверка модулей связана со своим регистровым файлом, взаимодействие которых осуществляется через блоки D.

Рассмотрим подробнее модуль M. Каждый модуль M ядра C674x за один тактовый цикл может выполнить

1 умножение 32x32 бита,

2 умножения 16x32 бита,

2 умножения 16x16 битов (в том числе, с возможностью накопления),

4 умножения 8x8 битов (в том числе, с возможностью накопления).

Кроме того модуль M поддерживает умножение комплексных величин, которое применяется во многих алгоритмах ЦОС (например, в быстром преобразовании Фурье).

Команда комплексного умножения в качестве входных данных использует 2 32-разрядных числа (по 16 разрядов для действительной и мнимой частей) и получает в результате 64-разрядное число (по 32 разряда в каждой части). Комплексное умножение с округлением формирует результат в виде 32-разрядного числа (по 16 разрядов в каждой части).

Ядро C674x использует двухуровневую архитектуру кэш-памяти. Первый уровень кэш-памяти команд (L1P) является прямым отображенным КЭШем размером 32 Кбайт. Первый уровень кэш-памяти данных (L1D) является ассоциативным кэшем объемом 32 Кбайт с двумя каналами доступа. Предусмотрена возможность независимо варьировать размер кэш-памяти, как команд, так и данных, выбирая одно из значений: 0К (то есть, отключать соответствующий кэш), 4К, 8К, 16К или 32К.

Память второго уровня (L2) состоит из пространства памяти размером 256 Кбайт, разделяемого между памятью данных и команд. Память L2 может быть конфигурирована как расширенная память, кэш или их комбинация.

Встроенные средства отладки (AET) могут использоваться как непосредственно для отладки программ, так и для оценки показателей производительности пользовательских приложений.

Периферийная система включает в себя набор функциональных модулей многократного применения (то есть, виртуальных компонентов, входящих в различные изделия компании TI без каких-либо изменений). В него входят:

Контроллеры прямого доступа к памяти с расширенными функциями (EDMA3) – один в OMAP-L137 и два в OMAP-L138.

Многоканальные последовательные аудио-порты (McASP) – три в L137

и один в L138.

Контроллеры последовательных интерфейсов: 2 многоканальных буферизованных последовательных порта (McBSP) – только в L138. 2 контроллера интерфейса I2C, 2 контроллера последовательного периферийного интерфейса (SPI), 3 универсальных асинхронных приемопередатчика (UART),

Контроллер жидкокристаллического дисплея (LCD Ctrl).

Интерфейс видеопорта (VPIF) – только в L138.

Page 170: Современные проблемы информатики и вычислительной техники

170 `

Универсальный параллельный порт (uPP) – только в L138.

Разделяемая память объемом 128 Кбайт.

Управляющие таймеры: Генераторы ШИМ-сигналов с расширенными функциями (ePWM) – три в L137 и два в L138, 3 модуля захвата с расширенными функциями (eCAP), 2 модуля кодера квадратурного датчика положения с расширенными функциями (eQEP) – только в L137.

Контроллеры коммуникаций: Хост-контроллер универсальной последовательной шины USB 1.1 OHCI, Порт универсальной последовательной шины USB 2.0 OTG, Ethernet-контроллер медиадоступа 10/100 Мб/с (EMAC), Контроллер интерфейса HPI, Контроллер карт памяти MMC и SD (MMC/SD), Контроллер интерфейса Serial ATA (SATA) – только в L137.

Контроллеры интерфейса подключения внешней памяти: Контроллер подключения модулей памяти SDRAM (шина данных – 16 бит), NAND и NOR (8 или 16 бит) объемом до 128 Мбайт (EMIF A), Контроллер подключения модулей памяти SDRAM (16 или 32 бит) объемом до 256 Мбайт (EMIF B) – только в L137, – Контроллер модулей памяти DDR2 и MobileDDR (DDR2/mDDR).

Порт ввода вывода общего назначения GPIO, включающий 9 независимых 16-разрядных регистров.

Управляющая система включает:

Модуль синхронизации (PLL/Clock Generator). В качестве основного задающего генератора может использоваться либо кварцевый резонатор, либо внешний синхросигнал. Частота входного синхросигнала – от 20 до 30 МГц. На схеме фазовой автоподстройки (PLL) входная частота умножается до частоты 600 МГц, из которой формируется ряд вторичных синхросигналов различных частот для синхронизации компонентов системы.

Часы реального времени (RTC). В качестве задающего генератора используется кварцевый резонатор часовой частоты 32 кГц.

Контроллер электропитания (Power and Sleep Controller). Контроллер управляет включением и выключением питания и синхронизации отдельных модулей, а также формированием сигналов сброса устройств и модулей. Позволяет обеспечить оптимальное регулирование потребляемой процессором мощности в зависимости от выполняемой в конкретный момент времени задачи.

Сторожевой 64-разрядный таймер (Watchdog) и универсальные 64-разрядные таймеры – один в L137 и три в L138.

Модуль конфигурации системы (SYSCFG). Модуль обеспечивает конфигурирование системы, а именно: управляет подключением входов и выходов периферийных модулей на внешние выводы микросхемы, назначением приоритетов периферийных модулей, устанавливает размеры буферных областей различного назначения и т.д.

Page 171: Современные проблемы информатики и вычислительной техники

171 `

Компания TI определяет следующие основные направления для применения процессоров OMAP-L1x:

Портативные приборы и устройства: аудио, измерительные, потребительского назначения.

Профессиональная аудиоаппаратура: микшеры, аудиосинтезаторы, аппаратура для широковещательной связи и звуковой конференцсвязи.

Автоматизация производства: программируемые контроллеры, тестовое и измерительное оборудование.

Применение в SDR (Software-Defined Radio).

Медицинская техника, в том числе портативная.

Рассмотрим, что делает эти изделия привлекательным для данных направлений. Для коммерческого успеха изделия на рынке портативных устройств наиболее существенными являются следующие факторы:

Потребляемая мощность.

Производительность и уровень интеграции.

Время выхода на рынок.

Цена.

Потребляемая мощность. Повышенная продолжительность автономной работы портативных изделий – большой плюс с точки зрения потребителя. Существуют также устройства с определенным лимитом энергопотребления, например изделия с питанием от порта USB или электроника с питанием от автомобильного аккумулятора. В процессорах OMAP-L1x реализованы передовые технологии минимизации потребляемой энергии в активном режиме, а именно:

Динамическая коммутация питания – в этом методе определяется момент, когда потребность в компоненте, который выполнил текущие задачи, временно отсутствует, после чего он переводится в состояние с низким энергопотреблением.

Динамическое масштабирование напряжения и частоты – тактовая частота и напряжение понижаются командами управляющей программы в зависимости от производительности конкретного приложения. Выше отмечалось, что на выходе PLL-схемы формируется основная последовательность синхросигналов с частотой 600 МГц. Однако программным образом можно установить значения 400 или 450 МГц.

У процессоров OMAP очень низкое энергопотребление, что для крайне важно мобильных устройств.

Page 172: Современные проблемы информатики и вычислительной техники

172 `

10.1.2.5 Мультимедийные DaVinci

Мультимедийные процессоры DaVinci специализированы для работы с цифровым видеосигналом и изображениями. Приборы являются комбинацией DSP + ARM ядер, блока аппаратных видео акселераторов и набора периферийных устройств, обычно используемых в видеоаппаратуре. Оптимизированы для кодирования/декодирования видеосигнала, поставляются совместно с мультимедийными кодеками и другим ПО.

DaVinci™ - основные свойства:

широкий ассортимент устройств для видео приложений, требующих поддержки разных форматов, многоканальной обработки сигналов в широком диапазоне бит-рейтов.

большой набор инструментов и ПО,

бесплатные кодеки и специализированные для мультимедийных разработок программные инструменты

DaVinci™ - уникальные особенности:

Мощная, проверенная практикой, масштабируемая платформа для разработки видеоприложений, содержащая: · подсистему видеоускорителей · поддержку широкого набора ОС и другого ПО · встроенные решения для голосовой и видео-коммуникации

Масштабируемые программируемые системы ЦОС на кристалле (SoC – System on Chips).

Ускорители и периферию.

Использование норматива 65 нм. Они оптимизированы для согласования требований по техническим характеристикам и стоимости.

Технология DaVinci - это основанное на ЦОС решение для цифровых видео-приложений:

Цифровые видеокамеры.

Page 173: Современные проблемы информатики и вычислительной техники

173 `

Цифровые медиа адаптеры.

Цифровые фотокамеры.

Цифровой телескоп.

Цифровой видео рекордер.

Электронные книги.

Интернет радио.

IP сетевые камеры.

Видео для автомобилей.

Медицинское видео.

Модули видеоконференций.

Портативные медиа плейеры.

Роботы.

Видео транскодеры.

Звонки видеодверей и др.

Поддерживаемые форматы кодирования в процессорах DaVinci и OMAP.

Кодек DaVinci OMAP

H264 Video Кодек Да Да

JPEG Image Кодек Да Да

MPEG2 Video Кодер Да Нет

MPEG2 Video Декодер Да Да

MPEG4 Video Кодек Да Да

AAC Audio Кодек Да Да

AC-3 Audio Декодер Да Нет

MP3 Audio Кодер Да Нет

MP3 Audio Декодер Да Да

WMA Audio Кодек Да Да

G711 Voice Кодек Да Да

G723 Voice Кодек Да Нет

G726 Voice Кодек Да Нет

G729 Voice Кодек Да Нет

DM643x. Для примера рассмотрим подробнее TMS320DM643x. Он содержит:

Подсистему ARM

Подсистему ЦПОС. Это сопроцессор обработки данных, использует ядро C64x+ с частотой 600 МГц.

Подсистему видеообработки с технологией DaVinci..

Переключаемые центральные ресурсы. Это периферийные устройства, системные устройства (таймеры и модулятор широтно-импульсной модуляции ШИМ), последовательные интерфейсы, память программ и данных.

Page 174: Современные проблемы информатики и вычислительной техники

174 `

Подсистема DSP (ядро C64x+) содержит:

Оно содержит 8 функциональных модулей, доступных по двум путям. В каждом пути имеются 32 регистра общего назначения РОН, аппаратный перемножитель M и 4 АЛУ (L, D, S).

Ядро имеет двухуровневый кэш:

L1D – кэш первого уровня 80 КБ для данных.

Page 175: Современные проблемы информатики и вычислительной техники

175 `

L1P – кэш первого уровня 32 КБ для программ.

L2 – общий кэш второго уровня 64 КБ для данных и программ.

Контроллер внешней памяти EMS позволяет в режиме прямого доступа использовать внешние хранилища данных.

Ядро ARM926EJ-S с частотой 300 МГц.

Подсистема видеообработки включает:

Входной каскад. Это интегрированный видеовход для получения аналоговых данных с видеокамеры. Включает средства для автофокусировки, масштабирования и предварительного просмотра.

Выходной каскад. Включает формирователь видео-окна для дисплея, видео-шифратор VEnc для цифрового кодирования картинки, выходы на 10-разрядные ЦАП.

Для доступа к внешним хранилищам данных имеются:

Контроллер памяти DDR2 (16 или 32 бита).

Интерфейс Async EMIF/NAND/SmartMedia - совмещенные интерфейсы асинхронной памяти EMIF, NAND флэш-памяти и карт SmartMedia.

Интерфейс ATA/Compact Flash - совмещенные интерфейсы карт ATA и компактной флэш-памяти.

Интерфейс MMC/CD. Работа с картой памяти Transcend MMC или с компакт диском.

Блок периферийных устройств содержит:

EDMA - Интегрированный чипсет управления памятью FSB.

USB 2.0 – универсальный последовательный интерфейс.

VLYNQ - высокоскоростной контроллер последовательной шины от TI.

EMAC - контроллер Ethernet MAC.

Блок последовательных интерфейсов поддерживает:

Аудио последовательный порт.

I2C - переход от параллельной передачи данных к последовательной.

SPI – синхронный последовательный периферийный интерфейс.

UART – универсальный асинхронный приёмопередатчик.

Процессор DaVinci DM6467 является однокристальным решением на базе DSP, созданным для обработки мульти форматного видео высокой четкости в режиме реального времени, которое содержит:

Ядро ARM926EJ-S с частотой 300 МГц.

Ядро C64x+ с частотой 600 МГц для ЦОС.

Сопроцессор обработки HD-видео. Он общается с интерфейсными портами видео и использует средства преобразования видео.

DM6467 поставляется с комплексом инструментов разработки и программным обеспечением для цифрового мультимедиа. В настоящее время новые процессоры предоставляются для испытаний с целью определения круга заказчиков. Их стоимость при массовых поставках составит около 36$.

10.1.3 Встраиваемые процессоры

Page 176: Современные проблемы информатики и вычислительной техники

176 `

Page 177: Современные проблемы информатики и вычислительной техники

177 `

10.2 DSP от Analog Devices

Компания ADI наряду с TI и Freescale вот уже более 20 лет является одним из крупнейших производителей DSP.

ADI была одной из первых компаний-производителей DSP, открывшей представительство в России. Этот факт, а также грамотная маркетинговая политика на российском рынке, активное взаимодействие с ведущими предприятиями и вузами страны и технические характеристики самих процессоров объясняют их большую популярность среди отечественных разработчиков.

На данный момент DSP от ADI применяются в очень широком спектре производимых в России устройств: в системах безопасности и видеонаблюдения, промышленных измерительных приборах, во всевозможных устройствах проводной и беспроводной связи, системах контроля и управления промышленным оборудованием и во многих других областях. Также следует отметить, что среди российских разработчиков популярность DSP от ADI, особенно таких универсальных, как семейство процессоров Blackfin, постоянно растет.

В настоящее время ADI производит DSP следующих семейств:

ADSP-21xx,

SHARC

TigerSHARC

Blackfin.

Они различаются по производительности, потребляемой энергии и цене.

В таблице дано сравнение некоторых ключевых характеристик семейств DSP ADI. Тактовая частота ядра, объем внутренней памяти и стоимость могут существенно варьироваться в зависимости от конкретной модели процессора, типа корпуса и рабочего диапазона температур. Обратите внимание на то, что цена процессоров в таблице указана при заказе партии от 1000 штук. Процессоры семейства ADSP 214xx пока еще доступны только в виде инженерных образцов, и информация об их стоимости на сайте ADI отсутствует.

Семейство Тип данных Разрядность Частота Память Цена

Page 178: Современные проблемы информатики и вычислительной техники

178 `

бит МГц КБайт $

ADSP 2118 ФТ 16 80 8 - 108

ADSP 2119 ФТ 16 160 8 - 64

ADSP-TS -20 ПТ/ФТ 8/16/32/40 300 -600 4096 - 24576 184 -250

ADSP-214 Sharc ПТ 32 -40 200 - 450 1024 - 5120 -

ADSP-BF5 ФТ 16/32 400 – 750 53 - 296 2 - 32

ADSP-BF6 ФТ 16/32 400 - 500 296 -

10.2.1 ADSP21xx

Компания ADI, первоначально специализировавшаяся исключительно на производстве аналоговых компонентов и микросхем ЦАП/АЦП, в 1986 г. вышла на рынок DSP, где до этого господствовала компания TI, с однокристальным процессором ADSP 2100.

Этот процессор положил начало семейству 16-битных процессоров с фиксированной точкой (ФТ), основанных на классической модифицированной гарвардской архитектуре.

В состав ядра ADSP 21xx входят:

АЛУ,

умножитель (MAC),

устройство сдвига;

Секвенсор - программный автомат, отвечающий за формирование адреса исполняемой команды, ее выборку из памяти и декодирование;

2 генератора адресов данных, вырабатывающие адреса для обращения к данным в памяти данных (ПД) и памяти программ (ПП);

набор шин для связи функциональных блоков ядра и периферии между собой.

Вычислительные узлы обеспечивают все вычислительные операции в процессоре. Каждый из них имеет собственный набор из входных регистров и регистра результата. Входными операндами в операциях вычислительных узлов могут являться данные из памяти программ или памяти данных, помещенные во входные регистры узла, или результат операции любого из узлов, доступный по шине результатов (R-шина).

Набор интегрированных периферийных модулей в процессорах ADSP 21xx весьма ограничен и, в зависимости от конкретной модели, может включать в себя последовательный порт, таймер, программируемые линии ввода/вывода (флаги) и контроллер DMA.

Сейчас компания ADI поддерживает только 3 подсемейства ADSP 21xx — ADSP 218x и ADSP 219x. В последнем из них разработчики отошли от классической архитектуры и применили ряд решений, уже

Page 179: Современные проблемы информатики и вычислительной техники

179 `

апробированных на тот момент в процессорах семейства SHARC. В частности, вместо выделенных входных регистров и регистров результата вычислительные узлы работают с регистровым файлом. Вместо работы с памятью программ на удвоенной частоте одновременное выполнение операций над операндами из памяти данных и памяти программ происходит за счет применения кэша команд.

Выделенные блоки памяти программ и памяти данных в ADSP 219x заменены 4 унифицированными блоками, любой из которых может быть подключен к шинам памяти программ и памяти данных через 2 мультиплексора. Все периферийные модули процессоров ADSP 219x и контроллер DMA работают под управлением процессора ввода/вывода, имеющего собственный набор шин адреса и данных. Структурная схема типичного представителя подсемейства ADSP 219x.

На сегодняшний день архитектура процессоров ADSP 21xx морально устарела, и, несмотря на то, что снятие микросхем ADSP 218x и ADSP 219x с производства планируется не ранее чем через 5–7 лет, компания ADI активно стимулирует пользователей к переходу на современные процессоры

10.2.2 SHARC ADSP2106

Семейство SHARC ADSP 21xxx состоит из 4 поколений недорогих 32-битных процессоров с плавающей точкой (ПТ), основанных на «супер гарвардской архитектуре» (Super Harvard ARChitecture - SHARC).

В архитектуре SHARC концепция использования раздельных шин памяти данных и памяти программ расширена за счет добавления процессора ввода/вывода) с эксклюзивным набором шин. Все процессоры SHARC независимо от поколения и порядкового номера имеют следующие общие архитектурные компоненты:

10-портовый регистровый файл данных.

1 или 2 вычислительных блока, каждый из которых содержит: умножитель, АЛУ, устройство сдвига.

Секвенсер - программный автомат, взаимодействующий с кэш памятью команд, интервальным таймером и двумя генераторами адреса данных (DAG1 и DAG2).

Процессор ввода/вывода с интегрированным контроллером DMA и набором портов для подключения внешних устройств.

2-портовая память SRAM, к которой может обращаться ядро и процессор ввода/вывода.

Порт JTAG для внутрисхемной эмуляции.

История первого поколения семейства SHARC ADSP 2106x берет начало в 1994 г. с процессора ADSP 21060, который, в свою очередь, был создан на базе не получившего широкого распространения более

Page 180: Современные проблемы информатики и вычислительной техники

180 `

раннего процессора ADSP 21020. Процессоры SHARC первого поколения основаны на принципе SISD (Single Instruction Single Data), то есть выполняют один поток команд, оперируя одним потоком данных. Их производительность была довольно высокой для своего времени и достигала 66 МГц/198 MFLOPs. Среди периферийных модулей процессоров ADSP 2106x были аппаратные средства для организации мультипроцессорных кластеров с общей шиной, высокоскоростные линк-порты для связи процессоров по схеме «точка–точка», последовательные порты и интегрированный SDRAM-контроллер. Схема типичного представителя процессоров SHARC первого поколения.

Архитектурная концепция семейства SHARC претерпела значительное изменение в процессорах второго поколения, ADSP 2116x, выпуск которых был начат в 1998г. Основное отличие процессоров второго поколения заключается в поддержке режима SIMD (Single Instruction Multiple Data) за счет добавления второго вычислительного элемента. По умолчанию активным является только вычислительный элемент PEX. Вычислительный элемент PEY включается программно установкой бита в соответствующем регистре. В режиме SIMD 2вычислительных элемента исполняют одни и те же команды, но над разными данными, что приводит к удвоению производительности в ряде задач, среди которых наиболее характерной является обработка звуковых стереосигналов.

Процессоры SHARC первых двух поколений позиционировались компанией ADI как решения для широкого спектра задач - от бытовой аудиоэлектроники до промышленных и военных систем.

Процессоры третьего поколения, включающего в себя семейства ADSP 212xx и ADSP 213xx, ориентированы в первую очередь на применение в аудиосистемах. Они имеют ту же архитектуру ядра, что и процессоры ADSP 2116x, но существенно отличаются от них в части организации памяти и архитектуры процессора ввода/вывода.

Память процессора была дополнена блоками внутреннего масочно-программируемого ПЗУ. При изготовлении некоторых микросхем семейства в эту память записываются различные алгоритмы обработки звука (Dolby Digital/Pro Logic, DTS, WMA, MPEG2 AAC), однако для приобретения таких процессоров необходимы соответствующие лицензии. Для поддержки высокой тактовой частоты работы ядра (до 200 МГц) в состав процессора включена программно конфигурируемая схема ФАПЧ. Однако основные изменения затронули процессор ввода/вывода.

Недавно ADI объявила о начале серийного выпуска процессоров SHARC четвертого поколения - ADSP 2146x. В этих процессорах беспрецедентное увеличение производительности достигается не столько за

Page 181: Современные проблемы информатики и вычислительной техники

181 `

счет увеличения тактовой частоты ядра до 450 МГц, сколько за счет аппаратных ускорителей для операций цифровой фильтрации и вычисления быстрого преобразования Фурье.

Ввиду прекращения развития семейства TigerSHARC справедливо полагать, что будущее высокопроизводительных процессоров компании ADI именно за этим направлением.

10.2.3 TigerSHARC ADSP-TS001

Семейство ADSP TigerSHARC объединяет высокопроизводительные процессоры, оперирующие данными с ФТ разрядностью 1, 8, 16 или 32 и с ПТ разрядностью 32/40 бит. Они основаны на архитектуре с очень длинным командным словом или ОДКС (Very Long Instruction Word, VLIW), которую компания ADI называет «статической суперскалярной». Такое название обусловлено тем, что, в отличие от полноценных суперскалярных процессоров, где упорядочивание и группирование отдельных команд в параллельно исполняемое командное слово осуществляется на аппаратном уровне, в процессорах

В TigerSHARC эта задача возлагается на программиста, пишущего программы на языке ассемблера, или на компилятор C/C++. Командное слово в процессорах TigerSHARC может включать в себя до 4-элементарных 32-битных команд, адресованных его разным функциональным узлам. Командные слова различной разрядности могут храниться в памяти процессора вперемешку и не требуют выравнивания по 128-битным границам. Окончание командного слова выделяется значением старшего бита в машинном коде его последней команды.

Ядро процессора ADSP TS101S содержит:

2 идентичных вычислительных блока (X и Y), состоящих из: АЛУ, умножителя (MAC), устройства сдвига, регистрового файла на 32 регистра по 32 бита каждый.

Секвенсер - программный автомат.

Внутренняя память, SRAM (М0, М1 и М2) по 2 Мбит.

Внешний порт.

Два АЛУ (J и K), выполняющие операции с целыми числами, используются для адресации данных и вычисления значений указателей. Наличие АЛУ такого вида позволяет существенно улучшить эффективность компилятора, разрабатываемого для данного процессора, а также повысить гибкость программирования.

Отдельные функциональные узлы ядра связаны друг с другом, подсистемой памяти и периферийными модулями тремя 128-битными шинами. Каждая шина жестко привязана к определенному блоку внутренней памяти SRAM (М0, М1 и М2) объемом 2 Мбит.

Page 182: Современные проблемы информатики и вычислительной техники

182 `

Процессоры TigerSHARC обладают наибольшей среди выпускаемых на сегодняшний день процессоров ADI производительностью, весьма недешевы (стоимость при заказе от 1000 штук 180-330$) и предназначены, преимущественно, для применения в сложных промышленных, телекоммуникационных и военных системах. Особый интерес эти процессоры представляют в задачах, где требуется большой объем вычислений, допускающих распределенную обработку при помощи многопроцессорных систем.

К сожалению, некоторое время назад компанией ADI было принято решение сосредоточиться исключительно на семействах процессоров Blackfin и SHARC, и в дальнейшем семейство TigerSHARC развиваться не будет. В то же время снятие этих процессоров с производства и прекращение их поддержки в новых версиях средств разработки пока не планируется.

10.2.4 ADSP21535 Blackfin

Самое новое на сегодняшний день семейство процессоров компании ADI — это Blackfin ADSP BF5xx. В основе процессоров Blackfin лежит «микросигнальная архитектура» (MSA, Micro Signal Architecture), разработанная ADI совместно с компанией Intel. Не секрет, что архитектура классических сигнальных процессоров, оптимизированная для интенсивных однотипных математических вычислений, далеко не столь эффективна там, где традиционно применяются микроконтроллеры, например, в задачах управления, организации пользовательского интерфейса, поддержке стеков сетевых протоколов и т. д. При создании архитектуры MSA преследовалась цель объединения достоинств двух классов процессоров в едином устройстве.

В основе всех процессоров ADSP BF5xx лежит ядро Blackfin,

Page 183: Современные проблемы информатики и вычислительной техники

183 `

Оно включает в себя следующие функциональные узлы:

вычислительный блок;

регистровые файлы;

блок формирования адресов;

блок управления.

Основу вычислительного блока составляют два умножителя-накопителя (MAC), каждый из которых представляет собой комбинацию 16-разрядного умножителя и 40-разрядного аккумулятора. Также в состав вычислительного блока входят 2 40-разрядных АЛУ, выполняющих стандартные арифметические и логические операции над 16- и 32-разрядными данными, 40-битное устройство сдвига и 4 8-разрядных видео-АЛУ, поддерживающих ряд операций над 8-разрядными данными, характерных для задач обработки видеоизображений. В одном цикле вычислительный блок может выполнять несколько операций над 16- или 32-битными данными с ФТ в режиме SIMD.

Источником и приемником данных при работе вычислительных блоков является регистровый файл данных.

Еще один регистровый файл входит в состав блока формирования адресов. Он содержит шесть регистров-указателей общего назначения (P5-P0) и специальные регистры для хранения указателя стека (SP) и кадра стека (FP). Непосредственно формированием адреса занимаются два генератора адреса данных (DAG). Они поддерживают режимы прямой адресации, косвенной адресации с пред- и постинкрементом и специфические для задач цифровой обработки сигналов режимы бит-реверсной и циклической адресации. Адресация может выполняться словами (32 бит) или побайтно.

Блок управления отвечает за выполнение команд ядром процессора. Адреса выполняемых команд формируются программным автоматом, который отрабатывает ситуации, приводящие к нарушению линейного порядка следования адресов. Сформированный адрес поступает в 10 уровневый конвейер команд, обеспечивающий выборку соответствующей команды и ее дешифрацию. Для повышения

Page 184: Современные проблемы информатики и вычислительной техники

184 `

эффективности выполнения циклов в состав блока управления включен буфер, играющий роль кэша для команд цикла. Процессор имеет набор команд переменной длины: наиболее часто исполняемые кодируются 16 битами, в то время как команды для цифровой обработки сигналов — 32 битами. Также в процессоре реализована ограниченная поддержка режима VLIW, при которой одна 32-битная команда выполняется параллельно с двумя 16-битными командами.

Система памяти процессора имеет иерархическую структуру, характерную для процессоров общего назначения. Первый уровень (L1) образуют несколько блоков памяти данных и памяти команд, которые могут выборочно конфигурироваться как кэш-память. Обращение к памяти L1 осуществляется на частоте работы ядра. В ряде процессоров Blackfin также имеется более медленная интегрированная память второго уровня (L2). L2 имеет больший объем и может использоваться для хранения как кода, так и данных. И, наконец, третий уровень (L3) — внешняя память. Отдельного пространства ввода/вывода в процессорах Blackfin нет, и все периферийные устройства отображаются в унифицированном 32-битном адресном пространстве памяти.

Набор периферийных модулей сильно варьируется от процессора к процессору и может включать помимо стандартных последовательных портов, выводов GPIO и таймеров также интерфейсные модули PCI, CAN, Ethernet, USB, контроллеры NAND флэш-памяти, ATAPI, параллельный порт для интерфейса с видеокодеками и быстродействующими АЦП и ЦАП и ряд других блоков.

Помимо возможности 8-битной адресации и многоуровневой системы памяти процессоры Blackfin поддерживают нескольких режимов функционирования с разными привилегиями доступа к внутренним ресурсам и имеют защиту памяти.

Одной из наиболее интересных черт процессоров Blackfin являются наличие сложной схемы управления энергопотреблением, позволяющей динамически изменять напряжение питания и тактовую частоту работы ядра, и несколько режимов пониженного энергопотребления. Это делает процессоры семейства очень привлекательными для использования в мобильных устройствах с питанием от аккумуляторов.

Выпуск процессоров Blackfin начался в 2001г. с процессора ADSP BF535. Этот процессор имеет ряд архитектурных отличий от более поздних представителей подсемейства ADSP 53x (32-битная внешняя шина, отсутствие динамического управления энергопотреблением и др.) и не получил столь широкого признания. В 2003г. была представлена линейка ADSP BF531/2/3, отличающихся друг от друга объемами внутренней памяти и градациями быстродействия. В 2005г. к ним добавились процессоры ADSP BF536/7/4 с дополнительными модулями CAN, TWI и 10/100 Ethernet MAC, а весной 2006г.— процессор ADSP BF538 с интегрированной флэш-памятью.

Осенью 2006г. компания ADI представила пять процессоров нового поколения ADSP BF54x, ориентированных на высокопроизводительные мультимедийные устройства, в которых в 2 раза была увеличена пропускная способность внутренних шин, увеличен объем внутренней памяти, добавлены новые интерфейсы USB high speed, ATAPI, NAND Flash, SDIO, DDR1, а также технология защиты данных LockBox.

Еще через год был анонсирован выпуск процессоров ADSP BF52x, предназначенных, в первую очередь, для использования в мобильных мультимедийных устройствах. Ключевой особенностью этого подсемейства является очень низкое энергопотребление как в статическом, так и в динамическом режимах. Также стоит особо отметить появление в составе ADSP 52x контроллера USB OTG и наличие в версии процессоров с индексом “C” (пока еще не вышедших в серийное производство) аудиокодека.

И, наконец, последнее заявленное на сегодняшний день подсемейство процессоров Blackfin — это ADSP 51x. Оно включает в себя ADSP BF512, самый недорогой и с наиболее низким уровнем энергопотребления процессор, в котором обеспечен оптимальный баланс производительности и степени интеграции периферийных модулей, и более мощные процессоры ADSP BF514/ADSP BF516/ADSP BF518 с расширенным набором периферии.

Последние два процессора имеют модули Ethernet MAC с поддержкой стандарта синхронизации IEEE 1588, что позволяет строить на их основе распределенные системы измерения и управления. Все процессоры этой линейки также имеют версии с индексом “F”, содержащие внутреннюю SPI флэш-память.

Page 185: Современные проблемы информатики и вычислительной техники

185 `

Отдельная ветвь развития семейства Blackfin — высокопроизводительные двуядерные процессоры, единственным представителем которых пока является ADSP BF561.

Наличие двух идентичных ядер дает не только существенный выигрыш в производительности, но и дополнительную гибкость при распределении вычислительной нагрузки.

Разумное сочетание стоимости, производительности и потребляемой мощности, а также богатый выбор периферийных модулей сделали процессоры семейства Blackfin очень популярными, в том числе и среди отечественных разработчиков. Процессоры Blackfin составляют основную долю в общем объеме продаж процессоров ADI, и в дальнейшем компания планирует активно развивать это семейство, дополняя его новыми, более производительными процессорами.

Вычислительная мощность DSP семейства Blackfin компании, тактовая частота 2-ядерных образцов которых составляет 750 МГц, позволяет им выполнять не только обработку сигналов, но и функции управления через интерфейсы USB 2.0 и 100-bit Ethernet. Ядро представляет собой 32-разрядный RISC-процессор. Микросхемы содержат блоки умножения с накоплением и специализированные блоки обработки. Отказавшись от названия DSC, компания представляет микросхемы этого семейства как встраиваемые медиа-процессоры. Микросхемы семейства могут выполнять функции "чистого" DSP, МК или совместно того и другого устройства.

10.2.5 Sigma

В настоящее время компания ADI расширяет свою линейку недорогих и эффективных цифровых процессоров со встроенными преобразователями сигналов SigmaDSP, предназначенных именно для цифрового сегмента рынка электроники.

Это семейство, первым представителем которого был процессор AD1954, обеспечивает:

Аудиообработку и преобразование сигналов профессионального качества (SNR до 112 дБ).

Простую технологию программирования с помощью дружественного графического интерфейса.

Очень низкие цены, позволяющие применять эти высококачественные процессоры даже в недорогой электронике.

Page 186: Современные проблемы информатики и вычислительной техники

186 `

10.3 DSP от Freescale

Для использования не только в качестве специализированных вычислителей, но и в качестве контроллеров, в бытовых электронных приборах, в системах адаптивной фильтрации выгодны DSP компании Freescale. Она является лидером по объему производства дешевых и достаточно производительных 16- и 24-разрядных DSP с ФТ.

Freescale входит в 20 крупнейших производителей полупроводников. Компания появилась в 2004г. Она образовалась в результате превращения подразделения Semiconductor Products Sector (SPS) компании Motorola в самостоятельное предприятие. Само же это подразделение начало свою деятельность в 1953 и внесло не один вклад в развитие полупроводниковой техники. В начале 90-х годов прошлого века, производство полупроводников составляло порядка 30% от всего бизнеса Motorola. Выделение SPS в отдельную компанию началось в конце 2003г., когда Motorola решила полностью отказаться от бизнеса полупроводников, акцентируя внимание на мобильной связи.

Штаб-квартира Freescale находится в Остине, штат Техас, США (Austin, Texas, USA). Производственные же мощности разбросаны по всему миру. На заводах компании работают десятки тысяч человек, а продукцию ее закупают десятки тысяч компаний. Компании принадлежит более 6000 патентов.

Выпускаются DSP разного назначения и производительности.

DSP с ФТ:

16-битные DSP561xx, DSP566xx, DSP568xx.

24-битные DSP560xx, DSP563xx.

32-битный DSP9600x.

MPC8260

DSP с ПТ:

StarCore. Высокопроизводительные.

DSP56K Symphony. Встроенные DSP с малым энерглпотреблением.

DSC (Digital Signal Controllers). Цифровые сигнальные контроллеры.

Встраиваемые процессоры:

Хост процессоры 8xxx, 7xxx, 7xx.

На платформе i.MX.

Сверхэкономичные ColdFire,

Многоядерные процессоры:

Коммуникационные на платформах OorOI.

Многоядерные аудио Symphony.

10.3.1 16–битные DSP

Семейство DSP56хх - это первый DSP от Motorola, разработанный "с нуля" и обеспечивающий интеграцию мощной архитектуры с возможностями МК. Архитектура семейства DSP56800 объединяет традиционные функции управления МК (MCU) с эффективностью DSP. Это сделано, чтобы позволить управляемым электроникой моторным системам выполнять усовершенствованные алгоритмы, предоставляя точность, улучшенный КПД и надежность, сейчас такой принцип нашел применение и в целом ряде других приложений. При высокой производительности DSP этого семейства отличает низкая стоимость. Сравнительные характеристики МП семейства DSP56xx представлены в таблице.

Page 187: Современные проблемы информатики и вычислительной техники

187 `

Тип DSP56824 DSP56F801 DSP56F803 DSP56F805 DSP56F807

ОЗУ Program 128х16 1Kx16 512x16 512x16 2Kx16

ПЗУ Program 32Кх16 8Kx16 Flash 32Kx16 Flash 32Kx16 Flash 60Kx16 Flash

ОЗУ Data 2Кх16 1Kx16 2Kx16 2Kx16 4Kx16

ПЗУ Data 2Кх16 2Kx16 Flash 4Kx16 Flash 4Kx16 Flash 8Kx16

Flash

ПЗУ загрузки - 2Kx16 Flash

2Kx16 Flash

2Kx16 Flash 2Kx16 Flash

Timer 3, 16-Bit 1 2 2 2

I/O 16 11 16 32 32

Послед. порты

1 SPI SPI SCI

SPI SCI CAN

SPI, 2 SCI CAN

SPI, 2 SCI CAN

АЦП - 2шт. 4кан. 12-bit

2шт. 4кан. 12-bit

2шт. 4кан. 12-bit

4шт. 4кан. 12-bit

ШИМ - 1шт. 6кан. 12-bit

1шт. 6кан. 12-bit

2шт. 6кан. 12-bit

2шт. 6кан. 12-bit

Питание 2.7В 3.3В 3.3В 3.3В 3.3В

F, МГц 70 80 80 80 80

МП данного семейства являются полностью 16-разрядными с длиной команд процессора в 16 бит, что обуславливает их несовместимость с другими семействами. Обобщенная структурная схема DSP семейства DSP568xx представлена ниже.

Новые в данном семействе устройства - DSP56F801/3/5/7, образцы имеют цену порядка 5$ в партиях от 10.000 штук. Они позиционируются для применения в системах управления двигателями и имеют flash-память программ, несколько каналов PWM (ШИМ – широтно-импульсная модуляция) с расширенными возможностями, многоканальный АЦП и контроллеры CAN, SCI и SPI интерфейсов.

10.3.1.1 DSP561xx

Основные характеристики семейства:

производительность до 30 MIPS на 60 МГц (цикл команды - 33,3 не);

параллельное выполнение умножения-суммирования 16 х 16 бит;

аккумулятор 2 х 40 бит с байтовым расширением;

высокий параллелизм при выполнении инструкций;

специальные режимы адресации для DSP;

вложенные аппаратные циклы DO, включая бесконечные циклы и циклы DO до 0;

быстрый автовозврат прерываний;

три вывода внешних прерываний;

16-разрядные внутренние шины адреса и данных;

режим Stop и режимы пониженного энергопотребления;

режим внутрисхемной эмуляции (OnCE);

пониженное энергопотребление (технология КМОП);

регулирование частоты работы от максимальной до DC (Direct Current).

В состав семейства входят: DSP56116, DSP56156, DSP56166, DSP56167. Все модели основаны на одном 16-разрядном процессорном ядре и отличаются размерами памяти и составом периферийных устройств. Обобщенная структура DSP этого семейства.

Page 188: Современные проблемы информатики и вычислительной техники

188 `

Пунктиром выделены блоки, составляющие процессорное ядро. На рисунке используются обозначения: ХАВ1, ХАВ2, РАВ - адресные шины памяти данных и памяти программ соответственно; XDB, PDB, GDB - шины данных: памяти X, памяти программ и общая шина данных соответственно. Использование 3-шинной гарвардской архитектуры приводит к увеличению производительности за счет параллельных пересылок.

Page 189: Современные проблемы информатики и вычислительной техники

189 `

10.3.1.2 DSP566xx

Семейство DSP566XX является программно совместимым с семейством 24-разрядных процессоров DSP563XX (упрощенная версия). Для этого введена еще одна память данных и реализован переход к трехшинной архитектуре. Производительность процессоров достигает величины 60 MIPS на частоте 60МГц.

Можно выделить следующие области целесообразного использования данного класса процессоров: цифровые АТС, обработка речи, тональный набор, цифровые TV и радио, диктофоны, автоответчики, автомобильные подсистемы, локальные сети, портативная техника.

Page 190: Современные проблемы информатики и вычислительной техники

190 `

10.3.1.3 DSP568xx

Семейство DSP56800 - это первый DSP от Motorola, разработанный "с нуля" и обеспечивающий интеграцию мощной архитектуры с возможностями МК. При высокой производительности DSP этого семейства отличает низкая стоимость. Архитектура семейства DSP56800 объединяет традиционные функции управления МК (MCU) с эффективностью DSP. Это сделано, чтобы позволить управляемым электроникой моторным системам выполнять усовершенствованные алгоритмы, предоставляя точность, улучшенный КПД и надежность, сейчас такой принцип нашел применение и в целом ряде других приложений. МП данного семейства являются полностью 16-разрядными с длиной команд процессора в 16 бит, что обуславливает их несовместимость с другими семействами.

DSP56824 имеет ОЗУ программ и данных 13.5Кх16 и возможность адресовать до 64Кх16 внешней памяти данных Х и 64Кх16 внешней памяти программ. В его структуре можно выделить:

16 линий GPIO (порты ввода/вывода общего назначения),

последовательные интерфейсы SPI и SSI,

порт эмуляции OnCE с 8-и уровневым FIFO-буфером,

интерфейс внешней памяти (порт А),

таймеры прерывания реального времени.

При частоте 70MГц процессор достигает производительности 35 MIPS. Новые в данном семействе устройства - DSP56F801/3/5/7, образцы имеют цену порядка $5 в партиях от 10.000 штук. Они позиционируются для применения в системах управления двигателями и имеют flash-память программ, несколько каналов PWM (ШИМ – широтно-импульсная модуляция) с расширенными возможностями, многоканальный АЦП и контроллеры CAN, SCI и SPI интерфейсов.

10.3.1.4 DSP58000, 16-битное ядро

Семейство DSP56800 использует 16-битное ядро, которое представляет собой программируемый КМОП 16-битный DSP, содержащий:

16-битное АЛУ данных,

16-битное устройство генерации адресов,

декодер программ,

эмулятор на кристалле,

объединенные шины

набор инструкций.

Программная память содержит два функциональных модуля:

память для программы начальной загрузки (ROM),

память для внешне-загружаемых программ (RAM).

Как мы видим, ядро DSP представляет собой композицию параллельно работающих функциональных устройств. Особенности ядра следующие:

производительность до 25 MIPS при работе на тактовой частоте 40 МГц;

устройство умножения с накоплением (MAC) разрядностью 16x16, выполняющее все операции за один командный цикл;

два 36-битных аккумулятора, включающих биты расширения для контроля переполнения результата;

16-разрядное устройство барабанного сдвига;

набор параллельных инструкций с уникальными режимами адресации;

аппаратная поддержка циклов и репликации команд;

два входа внешних прерываний;

три 16-битных шины данных;

три 16-битных шины адреса;

16-битная шина данных периферийных блоков;

набор инструкций позволяет поддерживать как операции DSP, так и функции контроллера;

Page 191: Современные проблемы информатики и вычислительной техники

191 `

получение компактного кода программного обеспечения в результате эффективной компиляции программы, написанной на языке Си;

система мультикоманд, поддерживающая функции ЦОС и МК управления.

программный стек подпрограмм и прерываний с неограниченной вложенностью;

расширенные внутри кристальные средства эмуляции для непосредственной, независимой от скорости процессора отладки;

режимы пониженного энергопотребления WAIT и STOP.

Контроллер программ, устройство генерации адресов и АЛУ данных имеют собственные регистры и логику управления, что позволяет им работать параллельно независимо друг от друга. Для повышения производительности используется конвейерная обработка, что упрощает параллельную работу функциональных моделей и снижает время выполнения каждой инструкции в отдельности.

Подсистема обработки команд и данных. Набор инструкций DSP данного семейства является самым лучшим среди других дешевых архитектур и разработан для программирования задач контроллерного типа. Инструкции общего назначения в стиле МК реализуют мощные режимы адресации и возможность манипуляции битами.

АЛУ данных выполняет все арифметические и логические операции с данными. Имеется возможность выполнения в одном цикле таких операций, как: умножение, умножение с накоплением, сложение, вычитание, сдвиги и логические операции.

Устройство генерации адреса представляет собой модуль предназначенный для вычисления адреса и состоит из блока арифметики для комплексного вычисления адреса и блока инкрементирования/декрементирования для простых вычислений. Вычисление адреса осуществляется модульным методом с автоматическим округлением при необходимости.

Программный контроллер. Программный контроллер предназначен для выполнения предвыборки и декодирования инструкций, управления аппаратными циклами и обработки прерываний.

Подсистема ввода/вывода. Интеллектуальная подсистема ввода/вывода, основу которой составляют порты ввода/вывода общего назначения (GPIO) имеет возможность гибкой переконфигурации. Имеющийся интерфейс может быть настроен, как непосредственно для ввода/вывода, так и для мультиплексирования между периферийными блоками МП и GPIO, а также в качестве выводов подсистемы прерываний, все это обуславливает компактность и гибкость конструктивно-функциональной реализации.

Средства разработки и отладки. Совсем недавно для создания программного обеспечения для систем управления на базе DSP было достаточно ассемблера, сегодня же ситуация кардинально меняется, смещая центр тяжести в сторону программ-компиляторов функционирующих в среде реального времени.

Несмотря на очевидную значимость аппаратных средств в процессе разработки, программным средам разработки сегодня уделяется гораздо больше внимания, поскольку с их помощью всю последовательность этапов разработки, не затрагивая дорогостоящую аппаратуру, до момента реализации приложения на плате.

Для создания ПО нового поколения (XXI века) для DSP нового семейства Star*Core, фирма Motorolla пошла на расширение соглашения с британской фирмой Signals&Software. На сегодня активно ведется разработка ПО для пейджинговых систем, сотовых телефонов и систем персональной связи. По данному соглашению предусматривается создание широкого круга программного обеспечения, в том числе и для кодеров CDMA, TDMA-стандартов, 3G систем, модемов и т.п. Такой же подход прослеживается при создании ПО и для других семейств DSP. Фирма Motorola создает программно-аппаратные комплексы разработки приложений для DSP. Наиболее распространенным среди них ввиду своей простоты и приемлемой стоимости является EVM Kit.

Более сложный комплекс для разработки приложений - ADS Kit. В кооперации с Metrowerks и другими независимыми компаниями Motorola предоставила среду разработки ПО для DSP и средства обнаружения ошибок, оценочные и для разработки систем платы, а также интегрированные программные модули. Предложение включает набор средств разработки программ (SDK) и прикладной интерфейс

Page 192: Современные проблемы информатики и вычислительной техники

192 `

(API), делающие возможной переносимость приложений между МК и DSP, сохраняя вложения клиентов в наследуемый код.

Кроме того, для отладки программ без применения каких-либо аппаратных средств различными "третьими" фирмами создаются симуляторы DSP, которые достаточно точно воспроизводят функции кристалла, включая все периферийные операции на кристалле, модификации памяти и регистров в соответствии с выполняемым программным кодом. Моделируется также функционирование конвейеризированных шин. Симулятор позволяет осуществить измерение времени выполнения кода, что особенно важно в приложениях ЦОС.

Так при реализации на базе DSP контроллера системы активного гашения акустического шума (внутри автомобиля, самолета и т.п.) использование симулятора позволяет еще на этапе проектирования получить оценочные данные времени адаптивной настройки системы гашения и оценить ее быстродействие.

Возможности встроенного эмулятора на кристалле (OnCE) обеспечиваются через отладочный порт, сформированный по стандарту JTAG. Это позволяет проводить отладку встроенных систем в реальном масштабе времени. Имеется возможность устанавливать аппаратные и программные точки останова, просматривать и изменять содержимое регистров и памяти, двигаться по шагам или перешагивать через последовательности инструкций в приложениях.

Области применения. DSP семейства DSP568XX используются в различных мультифункциональных системах управления (управление двигателями, энергоустановками), в средствах связи, в системах активного управления волновыми полями различной природы и т.п.

Например, в области связи, приложения, использующие механизм сообщений, такие, как двухволновые пейджеры или портативное двухволновое цифровое радио, используют формат PCS - персональное обслуживание связи.

Для этих приложений, требующих наличия DSP для обработки данных в реальном времени и МК для управления периферийными устройствами, идеально подходит семейство DSP56800, так как обе эти функции могут быть выполнены на одном устройстве.

Например, DSP выполняет операции голосового кодирования и декодирования, управление протоколами и предварительную коррекцию ошибок. DSP56800 с производительностью 20 MIPS может выполнять также функции модуляции и демодуляции, если это необходимо. Эффективные конструктивные решения семейства DSP56800 снижают энергопотребление.

Система цифровых сообщений на базе DSP56800

Электронные системы с двигателями. Для повышения эффективности систем управления двигательными системами в последнее время все больше используются интеллектуальные цифровые контроллеры, которые объединяют в себе функции как МК, так и DSP. Это дает возможность максимально гибко создавать эффективные решения, начиная от простых систем с разомкнутым цик

Применение DSP DSP568XX в области систем активного гашения шума. Активная система снижения шума (например, низкочастотного шума выхлопа двигателя, шума в салоне автомобиля, самолета и т.п.) представляет собой адаптивную систему фильтрации, работающую в реальном времени, которая базируется на совокупности возможностей современной ЦОС. Хотя частоты достаточно низкие и, таким образом, скорость дискретизации составляет несколько кГц, требуется обработка данных в большом объеме с большой скоростью.

Одним из требований к аппаратным и программным средствам является их способность полностью обеспечивать обработку данных в электрическом канале системы до того, как входной шум достигнет динамика. Другое ограничение, накладываемое на систему, состоит в том, что электрическая модель должна иметь достаточную длину для описания с приемлемой точностью передаточной функции прямого акустического канала на нижней граничной частоте диапазона снижения шума. Это ограничение становится наиболее жестким при использовании в алгоритме арифметики с фиксированной точкой.

Page 193: Современные проблемы информатики и вычислительной техники

193 `

В системах активного гашения использование DSP позволяет значительно повысить качественные характеристики и снизить общую стоимость систем. Обработка оцифрованного аналогового сигнала, полученного от датчиков шумового поля, а также оперативное изменение параметров фильтрации являются как раз теми задачами, где преимущества DSP перед методами аналоговой фильтрации очевидны. Для решения этой задачи необходима скоростная обработка звуковых сигналов, чтобы полученная "противофаза" шумового сигнала не имела фазового сдвига.

Также системы активного гашения шума широко используются в транспортных средствах (автомобилях, электропоездах, самолетах и т.п.). Однако, если в салоне помимо шумовых сигналов присутствуют источники полезной информации, например, от автомобильной аудиосистемы, то работа встроенных системы активного гашения (САГ) практически полностью блокируется. В качестве внешнего шумового поля САГ воспринимает сумму шума и полезного сигнала и в результате уровень низкочастотных составляющих музыкального сигнала значительно снижается.

Решение проблемы эксплуатации двухканальной аудиосистемы совместно с САГ. Гибридная система "САГ - аудио" использует метод подавления интерференции музыкальных сигналов позволяющий исключить аудиосигнал из сигнала датчика ошибки гашения. Это требует применения специальных LMS алгоритмов настройки фильтров, позволяющих точно оценить уровень аудиосигнала на выходе датчика ошибки. Необходимо чтобы метод подавления интерференции позволял адаптивно распознавать музыкальные составляющие и выделять их из сигнала ошибки гашения. Без использования метода подавления интерференции время сходимости LMS алгоритма значительно увеличивается и снижение внешнего шума невелико. Применение метода позволяет не только повысить на 3 - 5 дБ эффективность гашения, но и сократить время сходимости алгоритма.

Обобщенная структура процессора данного семейства представлена на рисунке (добавлен JTAG-интерфейс, изменена разрядность аккумуляторов).

Семейство имеет следующие основные характеристики:

производительность 20 MIPS на частоте 40 МГц (для DSP56L811), 35 MIPS на частоте 70 Мгц (для DSP56L812 и DSP56L824);

параллельный умножитель-сумматор 16 х 16;

Page 194: Современные проблемы информатики и вычислительной техники

194 `

два 36-разрядных аккумулятора;

два внешних запроса прерывания;

расширенные способы адресации;

инструкции, поддерживающие функции DSP и МК;

наличие эффективного C-компилятора;

режим внутрисхемной эмуляции;

управление энергопотреблением;

синтезатор тактовой частоты;

статическое исполнение.

В состав семейства входят процессоры:

DSP56L811. Процессор помимо ядра содержит:

ОЗУ программ - 1К х 16,

загрузочное ПЗУ - 64 х 16;

ОЗУ данных - 2К х 16;

таймер-счетчик событий;

синхронный последовательный интерфейс SSI;

порт JTAG/OnCE;

порт общего назначения GPIO (порт В) - 8 линий;

интерфейс SSI/GPIO - 6 линий;

два интерфейса SPIO/GPIO и SPH/ GPIO по 4 линии, предназначенные для подключения LCD-дисплея или МК;

программируемые прерывания/GPIO - 8 линий;

сторожевой таймер/прерывания реального времени;

синтезатор тактовой частоты, обеспечивающий гибкое регулирование потребляемой мощности.

DSP56L812. Данный процессор имеет такой же состав периферии, как и предыдущий процессор. Подсистема памяти включает: ПЗУ программ - 22Кх16; ОЗУ данных - 2Кх16; ПЗУ данных - 2Кх16.

DSP56824. Процессор имеет в составе следующую память: ПЗУ программ - 32К х 16; ОЗУ - 128 х 16; ОЗУ программ и данных - 13.5К х 16; ПЗУ данных - 2Кх 16; кроме того, процессор может адресовать до 64Кх1б внешней памяти данных X и 64К х 16 внешней памяти программ. Содержит следующий набор периферийных устройств: 16 линий GPIO; последовательные интерфейсы SPI и SSI; интерфейс внешней памяти (порт А); 5-выводной порт эмуляции ОпСЕ с 8-уровневым FIFO- буфером предыстории; таймеры прерываний в реальном времени (RTI). Процессор достигает производительности 35 MIPS на частоте 70МГц.

DSP семейства DSP568XX используются в различных мультифункциональных системах управления (управление двигателями, энергоустановками), в средствах связи, в системах активного управления волновыми полями различной природы и т.п.

В области телекоммуникаций. Например, в области связи, приложения, использующие механизм сообщений, такие, как двухволновые пейджеры или портативное двухволновое цифровое радио, используют формат PCS - персональное обслуживание связи. Для этих приложений, требующих наличия DSP для обработки данных в реальном времени и МК для управления периферийными устройствами, идеально подходит семейство DSP56800, так как обе эти функции могут быть выполнены на одном устройстве.

Электронные системы с двигателями. Для повышения эффективности систем управления двигательными системами в последнее время все больше используются интеллектуальные цифровые контроллеры, которые объединяют в себе функции как МК, так и DSP. Это дает возможность максимально гибко создавать эффективные решения, начиная от простых систем с разомкнутым циклом управления до адаптивных и нейроадаптивных систем.

Page 195: Современные проблемы информатики и вычислительной техники

195 `

Как отметил Дэйвид Тризенберг (David Triezenberg), директор по исследованиям и разработкам из Franklin Electric: - "Что мы приобрели с МК от Motorola - так это передовую архитектуру, обладающую чрезвычайно удачным и гибким модулем широтно-импульсной модуляции (PWM)." Устройства DSP56800 для управления двигателями от Motorola обладают множеством особенностей, разработанных для соответствия требованиям основанных на двигателях систем, включая: интегрированную FLASH-память, усовершенствованные модули ШИМ (PWM), оптимизированные для управления двигателями, интегрированные, со смешанными сигналами, периферийные устройства. В дополнение, семейство DSP56800 обладает синхронизацией АЦП и ШИМ. Все эти функции разработаны, с целью предоставления проектировщикам систем управления двигателями возможность оптимизировать алгоритмы.

Применение DSP DSP568XX в области систем активного гашения шума. Активная система снижения шума (например, низкочастотного шума выхлопа двигателя, шума в салоне автомобиля, самолета и т.п.) представляет собой адаптивную систему фильтрации, работающую в реальном времени, которая базируется на совокупности возможностей современной ЦОС. Хотя частоты достаточно низкие и, таким образом, скорость дискретизации составляет несколько кГц, требуется обработка данных в большом объеме с большой скоростью.

Одним из требований к аппаратным и программным средствам является их способность полностью обеспечивать обработку данных в электрическом канале системы до того, как входной шум достигнет динамика. Другое ограничение, накладываемое на систему, состоит в том, что электрическая модель должна иметь достаточную длину для описания с приемлемой точностью передаточной функции прямого акустического канала на нижней граничной частоте диапазона снижения шума. Это ограничение становится наиболее жестким при использовании в алгоритме арифметики с фиксированной точкой.

В системах активного гашения использование DSP позволяет значительно повысить качественные характеристики и снизить общую стоимость систем. Обработка оцифрованного аналогового сигнала, полученного от датчиков шумового поля, а также оперативное изменение параметров фильтрации являются как раз теми задачами, где преимущества DSP перед методами аналоговой фильтрации очевидны. Для решения этой задачи необходима скоростная обработка звуковых сигналов, чтобы полученная "противофаза" шумового сигнала не имела фазового сдвига.

Приведем несколько конкретных примеров систем активного управления волновыми полями. Для повышения индивидуальной акустической защиты от низкочастотных шумов используются активные наушники. Активные наушники представляют собой облегченные конструкции головных телефонов с МП блоком управления и системой миниатюрных излучателей. Они находят применение для защиты обслуживающего персонала сильно шумящего технологического оборудования, энергоустановок, летчиков палубной авиации и т.п.

Также системы активного гашения шума широко используются в транспортных средствах (автомобилях, электропоездах, самолетах и т.п.). Однако, если в салоне помимо шумовых сигналов присутствуют источники полезной информации, например, от автомобильной аудиосистемы, то работа встроенных системы активного гашения (САГ) практически полностью блокируется. В качестве внешнего шумового поля САГ воспринимает сумму шума и полезного сигнала и в результате уровень низкочастотных составляющих музыкального сигнала значительно снижается.

10.3.2 24 –битные DSP

Эти DSP обеспечивают низкое энергопотребление, нужное для радио, телекоммуникаций и мультимедиа устройств.

10.3.2.1 DSP560xx

Семейство DSP560XX, появившееся раньше других, можно считать базовым. Именно в этом семействе реализована концепция архитектуры, ориентированной на алгоритмы обработки сигналов. В рассмотренных ранее семействах архитектура подвергалась сокращениям, а в семействах DSP96000 и DSP56300 была расширена.

Основные характеристики семейства:

Page 196: Современные проблемы информатики и вычислительной техники

196 `

производительность более 30 MIPS при частоте 60 МГц;

выделены две памяти данных X и Y, что позволяет считывать одновременно два операнда;

на кристалле размещаются периферийные устройства, характерные для МК: SSI, SCI, PWM; отдельные представители семейства ориентированы на аудиоприложения и имеют специальный аудиоинтерфейс SAI;

система инструкций во многом аналогична системе инструкций МП семейства М68К;

24-разрядные регистры процессоров обеспечивают динамический диапазон 144 дБ, а 56-разрядные аккумуляторы - 336 дБ, что делает доступными для процессоров почти все приложения ЦОС;

в ПЗУ записываются таблицы sin (256 точек), arctg (256 точек), А/m-законы (256 точек).

Обобщенная архитектура процессоров семейства приведена на рис.1.26. Архитектура образована на базе 7 шин: трех адресных шин (ХАВ, YAB, РАВ) и четырех шин данных (XDB, YDB, PDB, GDB). Гарвардская архитектура в данном семействе получила дальнейшее развитие. Наличие второй памяти данных Y позволяет одновременно считывать два операнда и обеспечивать выполнение за один цикл операции MAC.

Page 197: Современные проблемы информатики и вычислительной техники

197 `

10.3.2.2 DSP563xx

Данное семейство основано на новом ядре, которое является развитием ядра, лежащего в основе семейства DSP560XX. При этом обеспечивается программная совместимость семейств на уровне объектных кодов. Переопределение ядра обусловлено новыми достижениями технологии, которые позволили создать прибор с низкой стоимостью, низким потреблением энергии и высокой производительностью.

Производительность практически линейно зависит от частоты: 66/80/100 MIPS на частоте 66/80/100 МГц. Процессоры допускают подключение медленной памяти, без потери производительности. Это достигается за счет введения в структуру процессора кэша команд объемом 1К х 24. На кристалле размещены (рис.1.27): синтезатор частоты, порт JTAG, используемый и для ОпСЕ, утроенный таймер (ТТ), host-интерфейс, расширенные синхронные последовательные интерфейсы ESSIO и ESSI1, контроллер кэша, последовательный коммуникационный интерфейс SCI, устройство управления мощностью, шестиканальный контроллер прямого доступа к памяти. В архитектуру процессора введена дополнительная шина данных DDB (DMA Data Bus), что позволяет с помощью контроллера ПДП передавать блоки информации, не замедляя работу процессора. В семейство входят следующие процессоры:

DSP56301. Процессор содержит базовый набор периферии. Подсистема памяти включает:

ОЗУ программ - 3072 х 24 и кэш инструкций - 1024 х 24;

ОЗУ данных X - 2048 х 24;

ОЗУ данных Y - 2048 х 24;

загрузочное ПЗУ объемом 142 слова, которое расположено также в области памяти программ.

Общий ввод/вывод данных организуется из портов В (24 линии, включая host), С (6 линий с ESSIO), D (6 линий с ESSI1), Е (3 линии с SCI) и утроенного таймера (3 линии). Host-интерфейс (HI) обеспечивает

Page 198: Современные проблемы информатики и вычислительной техники

198 `

передачу 32-разрядных слов. Поддерживаются индустриальные стандарты, принятые в компьютерной технике, МП, DSP и контроллерах прямого доступа. HI32 реализует три класса интерфейсов: шины PCI (спецификация версии 2.0), универсальная шина, общий порт ввода/вывода.

DSP56303. Данный процессор несколько упрощен по сравнению с DSP56301: шина адреса имеет 18 разрядов, host-интерфейс поддерживает передачу байтов (HI08). Интерфейс совместим со следующими типами интерфейсов без дополнительной логики: Motorola HC11, Hitachi H8, Intel 8051, Thomson P6. При минимальной дополнительной логике реализуются: шина ISA, интерфейс Motorola 68К, Intel x86.

DSP56305. Данное устройство имеет высокое быстродействие - 66/80 MIPS на частоте 66/80 МГц Процессор разработан для систем мобильной связи GSM, различных коммуникационных приложений. Эффективно выполняются алгоритмы компрессии речи, кодирования и декодирования, контроля. Процессор имеет следующую периферию: таймер(Т), интерфейсы ESSI0, ESSI1, SCI, интерфейс PCI (версия 2.1)/НI32, интерфейс ISA (требуется только буфер 74LS45), 8-разрядный HI08, реализующий шину ISA, шестиканальный блок ПДП, устройство управления энергопотреблением, порт OnCE/JTAG. Архитектурной особенностью данного процессора является также наличие трех сопроцессоров (как в DSP56304). Подсистема памяти может конфигурироваться. Ниже приводятся параметры блоков при включении кэша команд объемом 1К х 24: ОЗУ программ - 5632 х 24; ПЗУ программ - 6144 х 24; ОЗУ данных X - 3840 х 24; ОЗУ данных Y - 2048 х 24; ПЗУ данных Y - 3072 х 24; загрузочное ПЗУ - 192 х 24. Имеет возможность трассировки адреса внутреннего ОЗУ программ через внешний порт. Память DSP56305 включает: ОЗУ программ - 6,5К х 24; ПЗУ программ - 6К х 24; кэш инструкций - Ж х 24; ОЗУ данных - 5,75К х 24; ПЗУ данных - ЗК х 24. Дополнительно введен интерфейс памяти Ml.

DSP56306 поддерживает многофункциональные беспроводные и встроенные приложения ЦОС. В дополнение к большим объемам ПЗУ имеет механизм заплат ПЗУ, который облегчает модификацию программ. В состав периферии входят: тройной таймер, НI08, два ESSI, SCI. Производительность - 66MIPS.

DSP56307 поддерживает приложения беспроводной инфраструктуры с основными операциями фильтрации. Производительность - 100 MIPS на 100 МГц. Имеет на кристалле следующую периферию: фильтр-сопроцессор, HI08, два ESSI, SCI, тройной таймер. Объемы памяти на кристалле: ОЗУ - 64К, загрузочное ПЗУ - 192x24 бита,

DSP56309 поддерживает приложения, требующие большого объема памяти на кристалле - беспроводных инфраструктур. Производительность - 80 MIPS на 80 МГц. Периферия: HI08, два ESSI, SCI, тройной таймер.

DSP56311тподдерживает приложения многоканальных коммуникаций и сетевых систем. Производительность - максимальная для устройств этого класса - 255 MIPS с использованием сопроцессора в приложениях фильтрации сигналов. Периферия: HI08, два ESSI, SCI, тройной таймер. Расширение памяти программ и данных - до 4Мх24 бита каждая.

Особенности:

Скорость 80-100 MIPS при частоте 80/100 MHz и питающем напряжении 3.0–3.6 В.

Объектный код совместим с ядром DSP56000, имеющим набор RISK инструкций с высоким распараллеливанием

АЛУ данных с конвейеризированными 24х24 MAC, 56-битный параллельный барабанный сдвигатель (быстрый сдвиг и нормализация; битового потока генерация и parsing), условные АЛУ инструкции, 24-bit или 16-bit арифметики поддержка с программным управлением.

Модуль управления программой (Program Control Unit - PCU). Поддерживает независимый от позиции код (Position Independent Code - PIC). Режимы адресации оптимизированы для ЦОС (включая немедленные смещения). Есть контроллер внутреннего кэша инструкций, внутренний программно расширяемый аппаратный стек. Имеется аппаратный блок для реализации циклов DO с ветвлениями. Предусмотрены, прерывания для быстрого авто возврата.

Система фазовой автоподстройки частоты ФАПЧ (Phase Lock Loop - PLL). Позволяет изменять коэффициент деления частоты процессора для снижения энергопотребления без потери синхронизма.

Page 199: Современные проблемы информатики и вычислительной техники

199 `

Поддержка аппаратной отладки с использованием технологии JTAG и модуля эмуляции на кристалле (On-Chip Emulation - OnCE).

Прямой доступ к памяти (Direct Memory Access - DMA) с 6-ю DMA каналами, поддерживающими доступ к внутренней и внешней памяти.

Внутренняя периферия. На кристалле размещены:

32-битный параллельный PCI/Универсальный Хост интерфейс (HI32

Интерфейс с другими DSP563xx шинами или ISA интерфейс, требующий только буферов в стиле 74LS45.

Два расширенных синхронных последовательных интерфейса (Enhanced synchronous serial interfaces - ESSI), каждый с одним приемником и тремя передатчиками (всего 6 каналов).

Последовательный коммуникационный интерфейс (Serial communications interface - SCI) с baud rate генератором.

Модуль с 3-мя таймерами.

До 42 программируемых выводов общего назначения (General-purpose input/output - GPIO), определяющих доступ к периферии.

peripherals are enabled

Внутренняя память.

ПЗУ загрузчика (bootstrap ROM), 3K x 24-бит

Внутренняя оперативная память (RAM), 8K x 24-бит. Разделена на 4 банка размерами 4k, 3K, 2K, 1K.

Память программы (Program RAM).

Kэш инструкций (Instruction Cache).

Оперативная память данных X (X data RAM).

Оперативная память данных Y (Y data RAM).

Внешняя память.

Память данных расширяется двумя пространствами - по 16M в 24-разрядном режиме или по 64K в 16-разрядном режиме.

Память программ расширяется одним пространством - 16M в 24-разрядном режиме или 64K в 16-разрядном режиме.

Порт внешней памяти расширения.

Логика выбора кристалла для интерфейса SRAM.

Внутренний DRAM контроллер для DRAM.

Пониженное энергопотребление.

Использование КМОП с очень низким энергопотреблением.

Режимы ожидания и прекращения энергопотребления.

Полностью статический режим, тактовая частота 0.

Оптимизация энергопотребления.

Упаковка. DSP56301 iпоставляется в корпусах с 208 выводами (TQFP) или 252 выводами (MAP-BGA).

Page 200: Современные проблемы информатики и вычислительной техники

200 `

10.3.3 32-битные DSP

DSP9600x. Это 32-разрядные DSP, предназначенные для обработки данных в формате с ПТ, однако они могут выполнять и операции с ФТ.

Процессор содержит 2 идентичных порта расширения, обеспечивающих интерфейс с различными типами внешней памяти и других внешних устройств. Каждый порт может быть преобразован в хост-интерфейс, который дает возможность легко включить процессор в мультипроцессорную систему.

В состав процессора также входят:

внутренняя память программ, которая включает в себя 1024×32 ОЗУ, 64×32 ПЗУ загрузки и 1024×32 кэш-команд;

два блока внутренней памяти данных, каждый из которых содержит 512×32 ОЗУ и 512×32 ПЗУ;

три 32-разрядные шины адреса (XAB, YAB, PAB);

пять 32-разрядных шин данных (данные памяти программ – PDB, данные X – XDB, данные Y – YDB, глобальная шина – GDB и шина данных прямого доступа в память – DDB);

контроллер прямого доступа в память;

блок генерации адресов;

устройство управления программой с аппаратной поддержкой выполнения программных циклов и быстрым возвратом из прерываний;

операционный блок с двумя 32-разрядными АЛУ, (одно для операций с ПТ, другое – для операций с ФТ), умножителем-накопителем (МАС) разрядностью 32×32 и устройством сдвига;

два таймера;

схема эмуляции.

Производительность МП при тактовой частоте 40 МГц составляет 200 MIPS.

10.3.4 StarCore DSP

Ядра, системы и платформы, лицензии на которые можно приобрести у StarCore, делают досягаемыми быстродействие и эффективность, какие можно найти в лучших лицензионных DSP-архитектурах, но в

Page 201: Современные проблемы информатики и вычислительной техники

201 `

дополнение к этому они отличаются полной универсальностью и необыкновенной гибкостью благодаря своей масштабируемости.

DSP-ядра и платформы SC1200 и SC1400 сочетают высокую скорость, небольшие габариты запоминающего устройства программы и поразительную экономичность расхода энергии. Эта технология опирается на наследство в виде хорошо отработанного ядра SC 140 и надежную поддержку растущей сети торговцев прикладными программами и инструментальными программными средствами.

Архитектуры StarCore масштабируются, предусматривают совместимость кодов применительно ко всем прикладным программам и всем поколениям продуктов. Эти архитектуры основываются на 5-ступенчатом конвейере для беспроблемного программирования и были задуманы в расчете на высокую эффективность компилирования с тем, чтобы разработчики прикладных программ могли создавать программное обеспечение для DSP на языке Си в интересах более быстрого появления продукта на рынке.

Все ядра и системные IP-блоки синтезируются, обеспечивая покупателям возможность гибкого использования различных независимых производителей интегральных схем.

10.3.4.1 StarCore одноядерные

Сигнальные процессоры семейства MSC711x имеют высокопроизводительное ядро StarCore. Они ориентированы на использование в системах большой вычислительной мощности, например, в устройствах пакетной телефонии. Кристаллы этого семейства оптимизированы по цене и могут найти применение в оборудовании различной сложности.

MSC8101. Для процессоров ЦОС установление новых стандартов производительности, потребляемой мощности, размеров, плотности кода или простоты разработки является исключительным случаем. Но

Page 202: Современные проблемы информатики и вычислительной техники

202 `

достижение новых рубежей одновременно по всем этим параметрам - практически невозможно. Однако, все это достигнуто ядром Star*Core™ SC140.

Разработанное по технологии нового поколения "система на кристалле" для расширенных коммуникационных приложений, ядро SC140 является наиболее перспективным.

Четыре блока MAC в 16-разрядном ядре устанавливают новые уровни производительности DSP, превышающие один миллиард операций умножения-накапливания в секунду.

В то же самое время, SC140 необычайно эффективен в использовании мощности, кремния и кода программы. SC140 поддерживает эффективную компиляцию с языков высокого уровня (в отличие от большинства процессоров ЦОС).

Это поддержано набором средств разработки, которые дают заказчикам возможность создавать расширенные приложения DSP более быстро и эффективно.

В конечном счете ядро SC140 обеспечивает оптимальное сочетание эффективного программирования на языке C++, компактного кода и потребляемой мощности. SC140 ядро - первая реализация архитектуры Star*Core SC100. И SС140-ядро и SC100-архитектура - продукты уникального сотрудничества между двумя лидерами в области DSP: Lucent Technologies и Motorola.

SC140 - 16-разрядное ядро DSP, выпускается в настоящее время с тактовой частотой 300 МГЦ и диапазоном рабочего напряжения 0.9-1.5В. В основе ядра - двенадцать исполнительных устройств данных, состоящих из четырех MAC, четырех универсальных АЛУ и четырех устройств манипулирования битами (BFUS).

В дополнение к исполнительным устройствам данных, SC140 имеет два блока адресной арифметики (AAU), которые выполняют пересылки данных и вычисления адреса; одно устройство манипулирования битами (BMU), для действий на уровне битов и один блок ветвления. Устройство управления программами включает в себя программный контроллер, который выбирает команды и выполняет ветвления и циклы.

SC140 имеет конвейер с пятью ступенями, состоящий из предвыборки, выборки, декодирования, формирования адреса и выполнения. Такой относительно короткий конвейер по стандартам DSP делает более простым программирование на ассемблере и более эффективным ветвление и обработку прерывания.

Ядро имеет шестнадцать 40-разрядных универсальных регистров данных и двадцать семь 32- разрядных регистров адреса (шестнадцать из них универсальные).

Ядро имеет две 64-разрядных шины данных, что позволяет выбирать сразу до восьми 16-разрядных слов, и шину программ шириной 128 битов, что позволяет производить выборку шести команд за один цикл.

Page 203: Современные проблемы информатики и вычислительной техники

203 `

MSC8101 содержит на кристалле 512К памяти, коммуникационный процессорный модуль (СРМ), 64-битную шину PowerPC™, устройство системной интеграции (SIU) и 16-канальный механизм прямого доступа к памяти. СРМ представляет собой механизм коммуникационных протоколов на базе 32-разрядного RISC-процессора, который может работать по сети с линиями TDM, Ethernet и ATM. MSC8101 достигает производительности 1200 DSP MIPS или 3000 RISC MIPS при внутренней тактовой частоте 300 МГц. Процессор содержит: программируемый контроллер памяти, который может управлять 8 банками внешней памяти различного типа - SRAM, DRAM, EPROM, FLASH; расширенный фильтр-сопроцессор, работающий на тактовой частоте 300МГц и позволяющий обрабатывать фильтры как независимо, так и совместно; отдельное управление ФАПЧХ для ядра SC140, шины PowerPC и СРМ. Процессор имеет размеры 17x17 мм, энергопотребление 500мВт.

10.3.4.2 StarCore дешевые

MSC8113. Высоко интегрированная система на кристалле. Она содержит:

3 ядра StarCore SC140.

M2 RAM. 475 КБ память для буферизации критических и временных ланных данных.

boot ROM. 4 КБ программный загрузчик.

MQBus. Многоядерная шина, связывает все ядра с M2 RAM.

PLL. Внутренняя система автоподстройки частоты.

System связывает шину SQBus с внутренней системной шиной (Internal System Bus).

DSI (Direct Slave Interface) – прямой служебный интерфейс с хостом.

Memory Controller. Контроллер памяти, поддерживает разные типы памяти.

IP Master. Мастер IP протокола, который связывает модули интерфейсов с шинами Local Bus и SQBus.

Мост (Bridge), связывающий шины данных и системы устройтва.

32 Timers. 2 блока по 16 универсальных таймеров.

RS-232 последовательный интерфейс.

DMA. Многоканальный контроллер прямого доступа к памяти с 16 каналами с временным уплотнением.

4 TDMs. 4 независимых последовательных интерфейсов с временным уплотнением (TDM).

Page 204: Современные проблемы информатики и вычислительной техники

204 `

Ethernet контроллер. 10/100 Мб/с сигналы, MII/RMII/SMII.

UART. Универсальный асинхронный приемопередатчик. Полный дуплекс до 6.25 Мб/с

12 GPIO

I2C интерфейс.

8 программируемых аппаратных семафоров для обеспечения мрогопоточности.

GIC. Контроллер глобальных прерываний.

Каждое ядро SC140 имеет:

Секвенсер программы. Он получает инструкции через шину P из кэша инструкций (Instruction Cauch).

Address ALU. АЛУ адресов.

Address Register File. Регистровый файл адресов.

Data ALU. АЛУ данных.

Data ALU Register File. Регистровый файл данных.

JTAG. Отладчик.

EOnCE (Enhanced On-Chip Emulator). Усовершенствованный эмулятор на кристалле.

QBus. Внутренняя шина ядра.

QBus Interface. Включает переключатель шин, фиксатор, модуль управления, который выбирает QBus bank. us с шинами данных Xa, Xb, P.

M1 RAM. Внутреннее ОЗУ, 224 КБ SRAM.

Instruction Cauch 16 КБ кэш инструкций с 16 путями.

QBus Bank. Буфер записи с 4 входами.

PIC. Программируемый контроллер прерываний.

LIC. Локальный контроллер прерываний.

QBC. Указатели на содержимое внутренней памяти.

MSC8113 устройства предназначены для обеспечения оптимального решения для 3G беспроводных базовых станций, чтобы устранить из них дорогостоящие и энергопотребляющие ASICs и ПЛИС, применяемые в современных системах для достижения высокой скорости.

Page 205: Современные проблемы информатики и вычислительной техники

205 `

10.3.4.3 StarCore многоядерные

MSC8126. 4-ядерный DSP на основе новой разработанной Freescale технологии SC3850 StarCore.

Области применения:

Базовые станции WiMAX .

Медицинская рентгенография.

Аэрокосмическая и двойного назначения аппаратура.

Передовые измерительные и испытательные приборы.

Высокопроизводительные устройства обработки видео и аудио сигналов.

MSC8144. DSP содержит 4 ядра SC3400 StarCore и большой объем памяти, обеспечивая тем самым очень выгодную цену и потребление энергии на один канал.

MSC8144 спроектирован для получения наивысшей производительности, снижения стоимости аппаратуры и значительного повышения плотности каналов в следующем поколении проводной и радиоаппаратуры для создания инфраструктуры предоставляющей услуги передачи голоса, видео и данных. MSC8144 является оптимальным DSP для применения в радио инфраструктуре, такой как уплотнение скоростных потоков данных, передовые VoIP медиа шлюзы и серверы видеоконференций.

Улучшенный, более длинный конвейер инструкций DSP ядра SC3400, на основе которого создан DSP MSC8144, имеет более высокую скорость работы, поддерживает команды вида «одна инструкция -множество данных» (SIMD), точное предсказание исключений и ветвления программ. Ядро SC3400, кроме того, поддерживает дополнительные специализированные инструкции для Витерби и видео алгоритмов, которые теоретически удваивают производительность по сравнению с DSP StarCore предыдущего поколения. Каждое DSP ядро имеет 16КБ кэш инструкций, 32КБ кэш данных и MMU (схему управления памятью) для защиты адресного пространства памяти и задач, обеспечивает подключение распространенной быстродействующей памяти; и наконец, 66МГц 32-битный PCI интерфейс для высокоскоростного подключения других устройств.

Так как DSP ядро MSC8144 совместимо по кодам с предыдущим поколением DSP компании FREESCALE, использующих StarCore технологию, их пользователи могут немедленно начинать проектирование. Планируется выпуск MSC8144 DSP в 1ГГц и 800МГц версиях в 783-контактном 29х29мм FC-PBGA (пластиковый BGA корпус с перевернутым кристаллом) корпусе, используя передовую 90нм «кремний на изоляторе» технологию компании FREESCALE. Появление образцов микросхемы запланировано на 3 квартал 2006г., обеспечивая разработку чрезвычайно надежного программного обеспечения.

Так как расширенная система команд SC3400 является развитием текущей системы команд SC140, программное обеспечение MSC8144 полностью совместимо по машинным и ассемблерным кодам с существующими семействами одно- и многоядерных DSP компании FREESCALE, использующих технологию StarCore. Такая совместимость позволяет потребителям защитить свои инвестиции в программное обеспечение.

Page 206: Современные проблемы информатики и вычислительной техники

206 `

MSC8156. 6-ядерный DSP на основе новой разработанной Freescale технологии SC3850 StarCore, предназначен для улучшения возможностей оборудования для беспроводной связи. Добиться лидирующих уровней производительности и электропотребления стало возможным, благодаря применению технологического процесса 45нм.

Обладает отличными рабочими характеристиками: благодаря возможности работы каждого из 6 DSP ядер SC3850 StarCore с производительностью у каждого ядра 8000MMAC, общая производительность может достигать 48000 MMAC.

Page 207: Современные проблемы информатики и вычислительной техники

207 `

Отличительные особенности:

Два процессорных ядра RISC QUICC, независимых от DSP ядер.

Многоцелевой ускоритель MAPLE-B для высокоскоростного декодирования (Turbo), декодирования Витерби, дискретных преобразований Фурье прямого (DFT) и обратного (IDFT), быстрых преобразований Фурье прямого (FFT) и обратного (IFFT), CRCU.

Два контроллера DDR со скоростью передачи данных 800 МГц и 32/64-битной шиной данных DDR2/3 SDRAM.

1056КБ кэш L3.

Множество высокоскоростных коммуникационных и последовательных интерфейсов.

Отладчик JTAG.

Области применения:

Беспроводная связь следующего поколения, самые современные стандарты, такие как 3GPP, TD-SCDMA,3G-LTE, HSPA+, TDD-LTE.

Базовые станции WiMAX.

Медицинская рентгенография.

Аэрокосмическая и двойного назначения аппаратура.

Передовые измерительные и испытательные приборы.

Высокопроизводительные устройства обработки видео и аудио сигналов.

Блок-схема ядра SC3850.

Page 208: Современные проблемы информатики и вычислительной техники

208 `

10.3.5 Встраиваемые процессоры

10.3.6 Многоядерные процессоры

Дают выигрыш в экономичности при сохранении производительности.

Аппаратная многоядерная реализация возможна с использованием :

Гомогенных (одинаковых) ядер.

Гетерогенных (разных) ядер.

Page 209: Современные проблемы информатики и вычислительной техники

209 `

10.3.6.1 i.MX

I.MX 6 серия. Представляет масштабируемое семейство многоядерных процессоров приложений, основанных на архитектуре ARM Cortex-A9 ™, что позволяет создавать приложения нового поколения для планшетов, смарт-буков, информационно-развлекательных комплексов и электронных книг eReaders. Объединив интеграции мирового класса с 3D графикой, высококачественного видео и агрессивных методов управления питанием, i.MX 6-й серии обеспечивает платформу для неограниченных решений пользователям. Имеются серии с числом ядер 1, 2, 4.

i.MX 6Quad серия. Это последнее поколение высокопроизводительных мобильных приложений, таких как смарт-буки и планшеты высокого класса, где нужна высокая производительность мультимедийных возможностей, но ограничены запасы мощности аккумулятора питания. Семейство i.MX 6Quad решает эту проблему, предоставляя 4 ядра ARM Cortex-A9. Работает до 1,2 ГГц, имеет интегрированный модуль 3D графики, использует видео кодек с 1080 пикселей, обеспечивая при этом возможности управления питанием, что позволяет воспроизводить видео при потреблении от аккумулятора 350 мВт. Эта платформа обеспечивает новый уровень производительности мультимедийных устройств, идеальна для многих умных мобильных устройств.

10.3.6.2 ColdFire

Freescale ColdFire это развитие МП архитектуры 68k, ориентированное на применение во встраиваемых приложениях компании Freescale.

Набор инструкций ColdFire совместим на уровне ассемблера, но не на уровне машинного кода с 68000. В сравнении с классическими процессорами 68k, система команд больше не поддерживает двоично-десятичный формат данных BCD; удалены некоторые редко используемые команды; большинство команд поддерживает меньшее количество способов адресации. Блок вычислений с плавающей точкой поддерживает только 64 битные данные, 80-битные, как в сопроцессорах 68881 и 68882, не поддерживаются. Длина инструкций ограничена 2, 4 или 8 байт.

Существует 5 поколений линейки Coldfire:

v1: для перехода с 8-битных МК Freescale 68HC08, это урезанная версия v2. Запущена в 2006г., через 12 лет после оригинального Coldfire. Конкурент для ARM начального уровня.

Page 210: Современные проблемы информатики и вычислительной техники

210 `

v2: оригинальный Coldfire, стартовавший в 1994. Простой конвейер, без MMU, без FPU. Были версии с блоком умножения MAC и расширенным MAC.

v3: опциональный блок MAC.

v4: частично суперскалярное ядро.

v4e (eV4): расширенная версия v4, запущена в 2000г. Опциональные MMU, FPU и расширенный MAC.

v5: полностью суперскалярное ядро.

С ноября 2006г. архитектура ColdFire доступна для лицензирования.

Используется в семействах:

ColdFire. МК

V1 MCU

V2 MCU

ColdFire. Встраиваемые МП

V2 Embedded MPU

V3 Embedded MPU

V4 Embedded MPU

68k МП.

M683XX MPU

M680X0 MPU

ColdFire периферия

eTPU

MC68882

MCF51JE256 ColdFire. Мало знергопотребляющий МП, предназначенный для приложений, критичных к энергопотреблению. Как и все продукты с архитектурой ColdFire, MCF51JE256 поддерживается программными пакетами под бесплатную операционную систему MQX RTOS от компании Freescale.

MCF51JE256/128 – новейшее поколение 32-битных МК общего применения от компании Freescale, характеризующееся работой с ультранизким потреблением, возможность соединений посредством USB-интерфейса как в качестве хоста/ведомого, так и 1-ранговые, непосредственно между двумя устройствами, модули ЦАП/АЦП высокого разрешения, а также набором последовательных интерфейсов. Данные характеристики позволяют инженерам разрабатывать на базе семейства более полнофункциональные устройства при невысокой их стоимости.

10.3.6.3 PowerQUICC коммуникационные МП

Freescale принадлежит первое место в мире среди производителей МП для встраиваемых применений - 28,2% общемирового ранка этого вида продукции.

Встраиваемые процессоры, основанные на ядре PowerPC, используются более чем в 5000 моделей коммуникационных устройств и сетевого оборудования: базовых станциях беспроводной связи 2.5G и 3G, коммутаторах, маршрутизаторах, серверах удаленного доступа, системах VoIP, сетевых хранилищах. Можно сказать. что в этих областях архитектура PowerQUICC является стандартом де-факто.

PowerQUICC - имя aрхитектур Power, базируемых на МП от Freescale. Они построены вокруг одного или более ядер PowerPC и ядра QUICC, которое является отдельным ядром RISC. Они специализированы на таких задачах, таких как ввод/вывод, коммуникации, сети ATM с асинхронной передачей данных, ускорители безопасности, организация сети и USB. Много компонентов – это системы на кристалле для встраиваемых приложений.

МП PowerQUICC используются в организации сети, автонике, промышленности, системах хранения, печати и приложениях клиента.

Freescale используют процессоры PowerQUICC, как части их мобильной платформы mobileGT.

Page 211: Современные проблемы информатики и вычислительной техники

211 `

Есть 4 линейки процессоров, отличие в вычислительной мощности процессора и периферии.

PowerQUICC I. Предложены в 1995. 1-16/1-16 КБ L1 кэши инструкций……………….. или данных. Частота до 133 МГц. Есть Ethernet, USB, ATM.

PowerQUICC II. Предложены в 1998г. 16/316 КБ L1 кэши инструкций/данных. Частота до 450 МГц. Есть Ethernet, USB, ATM, VoIP. Развитие не планируется.

PowerQUICC II Pro. Предложены в 2004г. Использовано ядро e300. 32/32 КБ L1 кэши инструкций/данных. Частота до 677 МГц. Есть Ethernet, USB, ATM, VoIP, PCI и криптография.

PowerQUICC III. Предложены в 2005г.. Использовано 32-битное ядро e500 (Power ISA v.2.03). Частота до 1.5ГГц. Есть Gigabit Ethernet, USB, ATM, VoIP, PCI, RapidO и криптография. Будет заменена на QorIQ.

PowerQUICC II Pro

Особенно актуальна проблема хранения и обработки деловой информации (сообщений электронной почты, баз данных, результатов электронных транзакций и т.д.) для небольших предприятий, имеющих ограниченный штат IT-специалистов, не позволяющий поддерживать привычные серверные системы. Многие обычные пользователи сегодня используют персональные компьютеры, подключенные к различным сетям и различные мультимединые устройства для хранения обработки фото, видео и музыки в цифровом формате. Постоянно растущий объем такой информации также приводит к необходимости использования самостоятельных сетевых хранилищ данных. Необходимыми задачами для подобных систем хранения данных также является обеспечение функций защиты, разделения и ограничение доступа к данным определенных пользователей.

Новые процессоры Freecale MPC8314E, MPC8315E, MPC837xE относятся к семейству PowerQUICC II Pro и построены на основе архитектуры Power. Они принадлежат к классу устройств система-на-кристалле, обладают высоким уровнем производительности и интеграции, обеспечивают широкие функции защиты информации, а также энергосбережения. Процессоры включают в себя высокопроизводительное ядро e300, работающее на частотах до 667 МГц, поддерживают интерфейсы SATA, PCI Express, USB 2.0, Gigabit Ethernet, и имеют аппаратный модуль ускорения шифрования.

Новые представители еще более расширили семейство процессоров PowerQUICC II Pro. Freescale теперь предлагает на выбор широкий диапазон процессоров от недорогих (MPC8314E) до высокопроизводительных и высокоинтегрированных (MPC8379E). Это позволяет индивидуально, как по цене, так и по уровню быстродействия и функциональности, подобрать процессор, подходящий для каждого разрабатываемого устройства. При этом есть возможность отказаться от тех функций, которые не будут использованы в готовом устройстве. Следует отметить, что все процессоры семейства PowerQUICC II Pro построены на одном и том же ядре, что также упрощает процесс разработки. Нет необходимости заново создавать программное обеспечение при разработке нескольких устройств на базе представителей одного семейства процессоров.

Новое семейство можно условно разделить на две группы:

MPC8314E и MPC8315E - недорогие процессоры с базовым набором функций;

MPC8377E, MPC8378E, MPC8379E - высокопроизводительные и высокоинтегрированные решения.

Процессоры MPC8314E и MPC8315E предназначены для пользовательского рынка и рынка SOHO (Small Office - Home Office).

Процессор MPC8315E поддерживает RAID-массивы нулевого и первого уровней и удобен для создания медиа-серверов и сетевых хранилищ данных начального уровня.

MPC8314E отличается отсутствием контроллеров SATA и предназначен для построения недорогого пользовательского оборудования, такого как сетевые шлюзы, беспроводные точки доступа, системы печати и т.д.

Более производительные процессоры группы MPC837xE ориентированы на рынок устройств малого и среднего бизнеса, поддерживают RAID-массивы пятого уровня и удобен для создания сетевых хранилищ

Page 212: Современные проблемы информатики и вычислительной техники

212 `

данных. В то же время они отвечают всем требованиям для построения других систем рынка малого и среднего бизнеса, таких как точки доступа, сетевые шлюзы, маршрутизаторы и т.д.

Процессор MPC8379E имеет четыре SATA-контроллера и цепи физического уровня для них, что значительно уменьшает количество необходимых внешних компонентов и стоимость конечного устройства при создании сетевых хранилищ данных с использованием нескольких жестких дисков. Процессор MPC8378E поддерживает шину PCI Express и интерфейс SGMII, на его основе возможно построение точки беспроводного доступа. Третий представитель, MPC8377E, имеет по два контроллера SATA и PCI Express и предназначен для использования в многофункциональных системах хранения и печати информации.

Каждый из новых процессоров может поставляться в двух версиях: с аппаратным модулем шифрования и без него. Модуль шифрования позволяет снять с ядра процессора нагрузку по работе с алгоритмами шифрования, предоставляя ядру возможность работать с другими дополнительными приложениями.

PowerQUICC III Pro.

За время, прошедшее с момента ее появления, архитектура Power Architecture стала основой большого количества МП. Свидетельством потенциала, заложенного в Power Architecture, является постоянное появление новых продуктов на ее базе. Из недавних анонсов достаточно вспомнить двухъядерный процессор PWRficient, превосходящий по эффективности все существующие на 300-400%. На днях очередной Power-процессор, получивший обозначение MPC8544E, появился в ассортименте компании Freescale.

В новинке, полнившей семейство PowerQUICC III, высокая производительность сочетается со скромным энергопотреблением и богатым набором интерфейсов. В частности, в МП встроены порты PCI Express. Типовое энергопотребление MPC8544E равно 3,75 Вт. По мнению разработчика, возможность гибкого изменения конфигурации открывает перед новым членом семейства PowerQUICC III широкий круг применений. Среди наиболее перспективных областей применения, требовательных к вычислительному ресурсу общего назначения, названо сетевое оборудование, промышленные контроллеры, системы формирования и обработки изображений, беспроводные точки доступа и техника для видеосвязи. Напомним, осенью прошлого года ранее было представлено еще две модели PowerQUICC III, а премьера семейства состоялась летом того же года.

К ключевым особенностям MPC8544E производитель относит ядро e500v2, кэш-память второго уровня объемом 256 Кб, два интегрированных контроллера 10/100/1000 Ethernet с интерфейсами SGMII и три порта PCI Express. Реализовано аппаратное ускорение вычислений с удвоенной точностью и плавающей запятой, обработка сигналов и данных TCP, выполнение операций, связанных с обеспечением безопасности.

Модификации MPC8544 (без блока шифрования) и MPC8544E рассчитаны на выпуск по 90-нм нормам и оформление в 783-контактных корпусах типа PBGA. Ознакомительные образцы MPC8544 и MPC8544E должны появиться в начале второго квартала, а начало серийных поставок ожидается в четвертом квартале. Ориентировочная оптовая цена 1-ГГц версии MPC8544E - 70 долларов.

PowerPC E500 - 32-битная архитектура Power на основе МП ядра от Freescale. Ядро e500 поддерживает высокие характеристики системы на кристалле (SoC) сетевых процессоров. Имеются 3 версии ядра e500:

e500v1. Имеет 7-этапный конвейер с чисел с плавающей точкой, 32/32 КБ данных и инструкций кэши L1 и 256, 512 или 1024 КБ кэши L2. Частота от 533 MHz до to 1.5 GHz, Ядро спроектировано, чтобы конфигурироваться для встраисаемых устройств с использованием многоядерности

e500v2. Увеличено от 32-bit (4 ГБ) до 36-bit (64 ГБ) физическое адресное пространство (связано с фактически употребляемыми периферийными устройствами). Увеличен от 1ГБ до 4ГБ размер страниц. Добавлена удвоенная точность в формате с плавающей точкой. Удвоен размер и ассоциативность кэша уровня L2. Увеличено число допустимых промахов кэша от 3 до 4.

e500mc. Представлено в 2008г. Включает и виртуализацию встроенных платформ. Поддерживает от 2 до 32 ядер. Имеет встроенные акселераторы. Ядра имеют индивидуальные кэши L2 и общиt кэш L3, контроллеры и ускорители.

Page 213: Современные проблемы информатики и вычислительной техники

213 `

Сердцем платформы является технология CoreNet, представляющая собой масштабируемою архитектуру внутрикристального соединения. Главная цель при ее разработке – устранение недостатков разделяемой шины, используемой при построении современных многоядерных систем, с неизбежными для них потерями производительности из-за частых конфликтов, тем более выраженных, чем более многоядерной является сама система. Согласно заявлениям разработчиков, технология CoreNet способна обеспечивать эффективные взаимодействия 32 и более ядер, и поддерживать конфигурации с различными типами ядер (гетерогенные системы)

SerDes. В PowerPC e500 широко используются устройства SerDes.

Сериализатор/десериализатор (SerDes - Serializer/Deserializer) используется для преобразования между последовательными и параллельными шинами. В нем используется. LVDS (Low-Voltage Differential Signaling) - низковольтная дифференциальная передача сигналов. Это способ передачи электрических сигналов, позволяющий передавать информацию на высоких частотах при помощи дешёвых соединений на основе медной витой пары. Достоинство - малые излучаемые помехи (так как токи в проводниках пары малы, одинаковы, но противоположно направлены). Такой тип передачи называется токовая петля. Стандарт разрабатывался компанией TI. С 1994 LVDS используется для создания высокоскоростных компьютерных сетей и компьютерных шин. Стандартизована как ANSI/TIA/EIA-644-A в 2001г.

LVDS стала популярна в конце 90-х XX века. До того времени компьютеры были слишком медленны, чтобы требовать столь высоких скоростей передачи данных, и использовали большое количество проводников. Однако пользователи мультимедиа и суперкомпьютеров проявили широкий интерес к данной системе, так как нуждались в передаче больших объемов данных на расстояния порядка нескольких метров.

Когда скорости последовательной передачи не хватает, данные могут передаваться параллельно по нескольким парам LVDS для каждого бита или байта (например, как в PCI Express или в HyperTransport). Такая система называется шиной LVDS.

MPC8568. Компания Freescale заявила о выпуске нового поколения своих коммуникационных процессоров – PowerQUICC III, представленного на сегодняшний день двумя чипами: MPC8568E и MPC8567E. Технология QUICC Engine (Quad Integrated Communication Controller) предусматривает интеграцию в одной микросхеме двух ядер – собственно центрального процессора и дополнительного ядра, выделенного для обслуживания контроллеров встроенных интерфейсов. Чипы нового поколения построены с применением ядра e500 (архитектура Power), способного работать на частоте 1,33 ГГц и оснащены 512 Кб кэша L2, обеспечивая производительность свыше 3000 Dhrystone MIPs.

Дизайн новых процессоров оптимизирован для обеспечения требований, необходимых для реализации на их основе устройств широкополосного доступа: базовых станций 3G/WiMAX/LTE, контроллеров радиосети (Radio Network Controller, RNC), шлюзов и ATM/TDM/IP-решений. Поддерживается широкий набор высокоскоростных интерфейсов, включая Gigabit Ethernet, PCI Express и Serial RapidIO, сохранена совместимость с предыдущим поколением чипов PowerQUICC. Чипы MPC8568E и MPC8567E содержат программируемые функциональные блоки, обеспечивающие аппаратное ускорение обработки таких протоколов, как ATM, POS, Ethernet, PPP, HDLC и TDM. Таким образом обеспечивается разгрузка процессорного ядра, за счет этого способного выполнять программные задачи более высокого уровня.

К интегрированным функциональным блокам относятся также блок табличного поиска (Table Lookup Unit, TLU), контроллер DDR1/2, модуль аппаратного ускорения выполнения операций с плавающей запятой с двойной точностью и высокопроизводительный блок для ускорения работы с алгоритмами шифрования – DES/3DES, AES, ARC-4, Kasumi, MD5, SHA1/2, RSA и Elliptic Curve. За счет этого процессоры PowerQUICC III обеспечивают пропускную способность до 1 Гбит/с для таких популярных протоколов безопасности, как IPSec, SSL/TLS и 3GPP.

Начало отгрузок образцов MPC8568E и MPC8567E планируется на первый квартал 2007г. Цена – 100,8$ в партиях по 10 тыс. экземпляров.

MPC5125. MPC5125 – вычислительная платформа для автомобильных систем контроля и отображения, которая при малом уровне энергопотребления имеет в своем составе все, что необходимо для подключения к сети, а также контроллер дисплея и обширный набор устройств ввода-вывода. MPC5125

Page 214: Современные проблемы информатики и вычислительной техники

214 `

отвечает требованиям применения в автомобильной электронике и, таким образом, в ближайшие годы пользователи могут рассчитывать на конкурентную цену, качество, надежность и доступность.

MPC5125 использует ядро e300, основанное на наборе инструкций Power Architecture™. Встроенный процессор содержит одно ядро и несколько шин, исключающих образование «узких мест» при внутренней передаче данных. Благодаря отличному соотношению рабочей потребляемой мощности и производительности, появляется возможность снижения себестоимости системы и повышения надежности.

МП модуль TWR-MPC5125 – часть модульной платформы для проектирования Tower System компании Freescale. Он позволяет снизить затраты времени на проектирование, предоставляет доступ к множеству коммуникационных интерфейсов и, при этом, обладает конкурентной ценой и сверхмалым энергопотреблением без ухудшения производительности.

Отличительные особенности

Ядро e300c4 с архитектурой Power Architecture.

Контроллер графического ЖКИ, разрешением WXGA / 720 p, 24-битный цвет.

Двухканальный 10/100 Ethernet контроллер доступа к среде (MAC).

Двухканальный контроллер USB 2.0 (OTG).

Четыре модуля CAN 2.0 A/B.

Производительность 800 MIPS (млн. инструкций в сек.) при потреблении менее 1 Вт.

Бесплатные версия ПО Freescale MQXTM.

Бесплатный пакет поддержки платформы (BSP) Linux.

Идентификатор кристалла и внутри системно программируемое ПЗУ.

Двухканальный порт SD/SDIO.

Промышленная автоматика:

Программируемые логические контроллеры (PLC).

Шлюзы «полевая шина – Ethernet».

Контроллеры ввода/вывод.

Контроллеры процессов.

Контроллеры электродвигателей.

Робототехника

Промышленные сети. Шлюзы, маршрутизаторы.

Мосты, конвертеры интерфейсов.

Автоматизация зданий

Высокотехнологичные системы управления освещением.

Системы пожарной и охранной сигнализации: Управляющий контроллер (PLC или сетевой узел/шлюз). Панель управления.

Системы вентиляции и кондиционирования воздуха (HVAC): Центральная система управления. Управляющий контроллер.

Цифровое торговое и рекламное оборудование: Электронные вывески. Информационные терминалы. Торговые автоматы.

Медицинское оборудование: Кардиомониторы. Контроллеры больничных коек. Интеллектуальные шлюзы. GSM-шлюзы дистанционного мониторинга пациента. Портативное или недорогое диагностическое оборудование

Автомобильная электроника:

Приборные панели.

Система сбора и обработки данных (телематика).

Page 215: Современные проблемы информатики и вычислительной техники

215 `

10.3.6.4 Система на кристалле

Новый процессор MPC8540, построенный на оптимизированной платформе "система на кристалле" (system-on-chip), предназначается для высокоскоростных сетевых приложений. Это первый процессор компании Motorola с архитектурой межсоединений RapidIO. Сбалансированное соотношение производительности, пропускной способности и низкого энергопотребления делает MPC8540 мощным элементом управления сетевых маршрутизаторов и коммутаторов, подсистем хранения данных, устройств печати и формирования изображения.

Процессор использует ядро e500 с частотой 1 ГГц. В состав системы входят двухканальные гигабитные ethernet-контроллеры, контроллер 10/100, 64-битный контроллер PCI-X, работающий на частоте до 133 МГц, контроллер памяти DDR, четырехканальный DMA, многоканальный контроллер прерываний и последовательный интерфейс DUART.

Высокая степень интеграции упрощает дизайн платы и снижает потребляемую мощность. MPC8540 включает в себя 256 кбайт кэш-памяти второго уровня, модуль когерентности, который соединяет ядро и контроллер памяти с периферией процессора, и принципиально новый неблокирующий матричный переключатель OCeaN. Развивая концепции стандарта соединений RapidIO, OCeaN обеспечивает полностью двухсторонние соединения с параллельной пропускной способностью 128 Гбит/с, независимое формирование очередей транзакций и управление потоком.

MPC8540 будет совместим с широким диапазоном операционных систем, компиляторов и средств разработки. Кроме того, он будет производиться с использованием передовой 0.13-микронной технологии HiPerMOS 7 (HiP7). Производительность процессора будет варьироваться в диапазоне 600 МГц - 1 ГГц, потребление энергии на частоте 800 МГц составит 6.5 Вт. Поставки MPC8540 начнутся во второй половине 2002г.

QorlQ – коммуникационный МК.

Коммуникационная платформа на основе технологии PowerPC. Технология 45нм. Применение данной технологии позволило существенно сократить потребляемую мощность и избавить разработчиков от необходимости установки вентиляторных систем охлаждения. Для примера – 2-ядерный процессор семейства P2020 с поддержкой трех 1 Гб Ethernet-портов, PCI-express и памяти DDR3 на частоте 1,2 ГГц с производительностью 2,4 MIPS/МГц будет потреблять менее 8 Вт. Процессоры семейства QorIQ используют ядра e500, e500mc.

Включает семейства P1, P2, P4, P4, P5. В номерах по нарастанию повышается функциональность и производительность.

QorIQ P1

Это платформа нижнего уровня. Предназначена для шлюзов, Ethernet коммутаторов, беспроводного доступа, и систем управления общего назначения. Включает процессоры P1010, P1014, P1011, P1020, P1012, P1021, P1013, P1022, P1017, P1023. Они имеют сходную структуру, разница в деталях. Процессоры P1010, P1014 для примера. Параметры:

45-нм технология.

Корпус:425 вывода TEPBGA1, 19х19 мм.

1 ядро e500. 32KB/32КБ L1 кэши инструкций и данных. Частота до 0.8ГГц.

256КБ L2 кэш.

Контроллер памяти:

DDR3, 3L.

16-/32-битная шина данных с поддержкой ECC.

Высокоскоростные соединения:

6 линий SerDes с частотой 3.125ГГц.

2 контроллера PCI Exprss.

2 интерфейса SGMII.

Page 216: Современные проблемы информатики и вычислительной техники

216 `

2 контроллера SATA.

1 контроллера USB 2.0 с PHY.

Последовательный периферийный интерфейс.

Ethernet:

3 контроллера 10/100/1000 Ethernet.

TCP/IP классификация и акселерация.

Поддержка интерфейса IEEE® 1588.

Управление потоком данных без потерь пакетов.

SGMII, RGMII.

Дополнительный периферийный интерфейс:

4 канальный контроллер DMA.

2 контроллера DUART.

Контроллер флэш карт.

QorIQ P2

P2 – платформа среднего уровня. Предназначена для широкого применения в сетях, телекоммуникациях, военной технике и промышленности. Используются высококачественные компоненты, температура 0т -40 до 125. Включает процессоры P2010., P2020, P2040. Они имеют сходную структуру, разница в деталях..

Процессоры P2010., P2020. Параметры:

45-нм технология. Корпус:783-вывода FGPBGA, 23х23 мм.

4 ядра e500mc. В каждом 32KB/32KB L1 кэши инструкций и данных.

Частота до 1.2ГГц.

Общий 512КБ L2.

Контроллер памяти:

DDR3/DDR3 SDRAM.

32-/64-битная шина данных с поддержкой ECC.

Page 217: Современные проблемы информатики и вычислительной техники

217 `

Высокоскоростные соединения:

10 линий SerDes с частотой 5ГГц.

3 контроллера PCI Exprss 2.0 с частотой 5ГГц.

2 контроллера Serial RapidO с частотой 5ГГц.

2 контроллера SATA 2.0 со скоростью 3Гб/с.

2 контроллера USB 2.0 с PHY.

Ethernet:

3 контроллера 10/100/1000 Ethernet.

Поддержка интерфейса IEEE® 1588.

Управление потоком данных без потерь пакетов.

5 SGMII, 4 2.5Гб/с SGMII, 2 RGMII.

Ускорение путей к данным (SEC 4.2):

DES, AES, ARC4, Snow 3G F8 и А9, CRC, Kasumi.

PME 2.1: поиск 128-байтового текста в 32КБ фрагменте в 12МБ сессии.

RapidIO сообщения: тип 9 и 11

Дополнительный периферийный интерфейс (eLBC). Шина 16 бит.

Доступ к картам SD/MMC.

Контроллер прерываний SPI.

4 I2C контроллера.

3 контроллера PCI Express 2.0 с частотой 5ГГц.

2 контроллера DUART.

QorIQ P3

P3 - платформа среднего уровня, многоядерная.

P3041.

Параметры:

45-нм технология.

Тепловыделение 12Вт.

Корпус:1295-выводов FGPBGA, 37.5х37.5 мм.

4 ядра e500mc. В каждом 32 KB L1 кэш инструкций и 32 KB L1 кэш данных, 128KB backside L2 кэш.

Частота до 1.5ГГц.

Общий 1024КБ frontside L3 кэш на платформе CoreNet (фабрично интегрирован в чип).

Контроллер памяти:

DDR3, 3L с частотой до 1.3ГГц.

32-/64-битная шина данных с поддержкой ECC.

Высокоскоростные соединения:

18 линий SerDes с частотой 5ГГц.

4 контроллера PCI Exprss 2.0 с частотой 5ГГц.

2 контроллера Serial RapidO с частотой 5ГГц.

2 контроллера SATA 2.0 со скоростью 3Гб/с.

2 контроллера USB 2.0 с PHY.

Ethernet:

5 контроллеров 10/100/1000 Ethernet.

1 контроллер 10 Gigabit Ethernet.

У всех классификация, аппаратное расписание, буферы, вычисление контрольной суммы и

Page 218: Современные проблемы информатики и вычислительной техники

218 `

перезагрузка, QoS, поддержка интерфейса IEEE® 1588, управление потоком данных без потерь пакетов.

До 1 XAUI, 4 SGMII или 2.5Гб/с SGMII, 2 RGMII.

Ускорение путей к данным:

SEC 4.2 – акселератор общего ключа, DES, AES, акселератор обзора сообщения, генератор случайных чисел, ARC4, Snow 3G F8 и А9, CRC, Kasumi.

PME 2.1: поиск 128-байтового текста в 32КБ фрагменте в 12МБ сессии.

RapidIO сообщенияj: тип 9 и 11

QorIQ P4

P4 - платформа высшего уровня, для головных сетей и маршрутизаторов и свитчеров высшего уровня. Поддержка до 8 ядер e500mc с частотами до 1.5 ГГц, когерентность ядер прошита.

Процессор P4040. Параметры:

45-нм технология. Корпус:1295-выводов FGPBGA, 37.5х37.5 мм.

4 ядра e500mc. В каждом 32 KB / 32 KB L1 кэши инструкций и данных, 128KB backside L2 кэш. 2 общих frontside L3 кэша по 1024КБ.

Частота до 1.5ГГц.

Платформа CoreNNet для иерархических связей компонент:

Поддерживает когерентные и некогерентные транзакции с приоритетами.

Скорость 800Гб/с.

Менеджер очередей с буфером.

Контроллеры памяти:

2 контроллера DDR2/DDR3 SDRAM.

64-битные шины данных с поддержкой ECC.

Ускорение путей к данным:

Выделение, классификация и распределение пакетов.

Менеджер очередей для расписаний.

Криптография SEC 4.0.

RegEx согласование последовательностей (PME 2.0).

RapidIO сообщения: тип 9 и 11.

Ethernet:

8 контроллеров 1 Gigabit Ethernet (SGMII).

2 контроллера 10 Gigabit Ethernet (XAUI).

Высокоскоростные периферийные интерфейсы:

3 контроллера PCI Exprss 2.0 с частотой 5ГГц.

2 контроллера Serial RapidO с частотой до 3.125ГГц.

Дополнительный периферийный интерфейс (eLBC).

2 контроллера USB 2.0 с PHY.

Доступ к картам SD/MMC.

Интерфейс ввода-вывода общего назначения GPIO.

Контроллер прерываний SPI.

4 контроллера PCI Express 2.0 с частотой 5ГГц.

2 контроллера DUART.

Отладка в реальном времени.

Page 219: Современные проблемы информатики и вычислительной техники

219 `

QorIQ P5

P5 - платформа высшего уровня. Основана на 64-битном ядре e5500, контроллеры памяти 1.3 ГГц 64-бит DDR3. 18 SerDes линий для сетей, аппаратные акселераторы для работы пакетной и по расписанию, регулярные выражения, RAID, защита, криптография и RapidIO. Предложена в 2010г.. P5010 - Ядро e5500 2.2 ГГц, 1 MB кэш L3, DDR3, технология 45-нм, тепловыделение 30Вт.

P5020 – 2 ядра e5500 2.2 ГГц, двойной 1 MB кэш L3, 2 DDR3 контроллера, технология 45-нм, тепловыделение 30Вт.

10.4 Samsung

10.4.1 Одноядерные DSP

Процессоры Samsung S3C2440 работают на сравнительно высоких частотах 300-400 МГц и имеют шину данных в 32 бита. Это дает преимущество не только в скорости обработки информации, но и в доступе к памяти. К сожалению, никаких дополнительных возможностей процессор Samsung не имеет, за исключением опционального USB-Host. Именно поэтому он и является бюджетным решением для большинства производителей компактных ПК.

Процессоры Samsung используются не только в дешевых мини-компьютерах, как например, в Qtek G100 с GPS- навигацией, но и в более дорогих: HTC MTeoR, HTC TyTN, HTC P3600.

Причина такого решения: вышеперечисленные коммуникаторы HTC работают в сетях 3 поколения. В TI OMAP 850 есть поддержка сетей 2 поколения (GPRS/EDGE), но нет 3G/3G+. В результате, в 3G коммуникаторы HTC пришлось вставить дополнительные и дорогостоящие микросхемы Qualcomm, графический акселератор ATI, и более оправданный, в данном случае, процессор Samsung S3C. Коммуникаторы получились сбалансированными и не слишком дорогими.

10.4.2 Многоядерные DSP

Page 220: Современные проблемы информатики и вычислительной техники

220 `

10.4.3 Exynos 4 Quad

Пресс-служба корпорации Samsung продемонстрировала 4-ядерный процессор Exynos 4 Quad, который разработан специально для мобильных устройств. Впервые новый процессор будет использован в новом смартфоне Galaxy. Его предварительное название, по аналогии с предыдущими аппаратами, скорее всего Galaxy S III.

Представители Samsung заявляют, что по производительности новый процессор вдвое опережает Exynos 4 Dual, на котором основаны аппараты Galaxy S II, Galaxy Note и Galaxy Tab 7.7. Exynos 4 Quad построен на архитектуре ARM Cortex A9. Тактовая частота процессора составляет 1,4 ГГЦ на ядро. При этом Exynos 4 Quad потребляет на 20% меньше энергии, чем его предшественник. Чип производится по 32-нм техпроцессу.

Схема чипа предусматривает наличие сопроцессора для обработки сигнала со встроенной камеры, благодаря чему смартфоны и планшеты на основе Exynos 4 Quad смогут записывать и воспроизводить видео в разрешении 1080p с частотой до 30 кадров в секунду. Также Exynos 4 Quad поддерживает интерфейс HDMI 1.4.

Правда, в Samsung пока не уточняют, смогут ли аппараты на базе Exynos 4 Quad подключаться к сетям LTE. 4-ядерные процессоры Tegra 3, которые используются, к примеру, в HTC One X, такой возможности не обеспечивают.

10.4.4 Exynos 5 Dual

Samsung представила технические подробности о своём долгожданном 32-нм Exynos 5250, который теперь получил имя Exynos 5 Dual — благодаря этому мы можем узнать массу новых интересных данных о мобильном процессоре нового поколения корейской компании, который выйдет на рынок в текущем году, предположительно в 11,8-дюймовом планшете.

К наиболее важным особенностям чипа следует отнести следующие:

2 ядра Cortex-A15 с частотой 1,7 ГГц.

4-ядерная графика Mali T604, поддерживающая стандарт OpenGL ES 3.0, OpenCL 1.1 и DirectX 11.

Поддержка разрешений экрана вплоть до WXQGA (2560x1600).

Поддержка вывода картинки на внешний экран через Wi-Fi Display.

Встроенный 2-канальный контроллер оперативной памяти LPDDR3 с частотой 800 МГц, обеспечивающий пропускную способность 12,8 Гбайт/с;

Page 221: Современные проблемы информатики и вычислительной техники

221 `

Аппаратное кодирование/декодирование видеопотока в разрешении 1080p с частотой 60 кадров/с и поддержка кодека VP8;

Поддержка стандарта USB 3.0.

Новый процессор Samsung получит не только процессор, но и GPU следующего поколения — Mali T604, причём ускоритель тоже разработан компанией ARM. Графика Mali T600 — это первые GPU ARM, основанные на архитектуре Midgard, которая приносит универсальные шейдерные процессоры, полную поддержку стандартов OpenGL ES 3.0 и OpenCL 1.1.

Таким образом, графика позволит разработчикам не только создавать более впечатляющие игры, но также ускорять самые различные приложения (обычно всё же близкие к графике) при помощи мощностей GPU через OpenCL. ARM утверждает, что производительность Mali T604 в 5 раз выше, чем у графики предыдущего поколения. Впрочем, Samsung указывает на куда меньший прирост:

Сравнение 3D-производительности

Для обеспечения нормальной работы экранов высокого разрешения WXQGA (2560x1600), что в четыре раза выше по числу точек стандартного сегодня для планшетов Android разрешения в 1280x800, необходима не только мощная графика, но и прекрасная пропускная способность оперативной памяти. К счастью, в Exynos 5 Dual инженеры об этом позаботились — чип поддерживает передачу данных на скорости 12,8 Гбайт/с, благодаря использованию памяти LPDDR3 с частотой 800 МГц. Это вдвое больше, чем у Exynos 4 с его памятью LPDDR2 400 МГц, и заметно быстрее Snapdragon S4, поддерживающего LPDDR2 500 МГц.

Page 222: Современные проблемы информатики и вычислительной техники

222 `

Сравнение пропускной способности памяти чипов Exynos

Дисплеи высокого разрешения требуют заметно больше энергии. Производители нивелируют это более эффективными GPU, батареями повышенной ёмкости и новыми технологиями экранов. Exynos 5 Dual поддерживает режим PSR, который позволяет в 20 раз сократить расход энергии чипа на вывод изображения при отображении статической картинки вроде электронной книги, веб-страницы или фотографии. Режим PSR в отдельных случаях может заметно повысить эффективность работы устройства.

Поддержка кодирования и декодирования видео в разрешении 1080p при 60 кадрах/с может показаться не столь уж полезной функцией (хотя плавность записываемого видео заметно возрастает), однако эта особенность может быть нужной при просмотре стереоскопических материалов в разрешении Full HD. Exynos 5 Dual также поддерживает технологию Wi-Fi Display, которая позволяет передавать всё с экрана устройства на телевизор с частотой не менее 30 кадров/с. Не стоит забывать и об аппаратной поддержке видеокодека Google VP8, использование которого в Сети будет, несомненно, постоянно возрастать. До последнего времени отсутствие поддержки аппаратного декодирования VP8 в большинстве мобильных устройств было большим минусом этого стандарта по сравнению с H.264.

Ещё одной уникальной функцией, которую Exynos 5 Dual приносит впервые на мобильный рынок, является поддержка стандарта USB 3.0, пиковая пропускная способность которого в 10 раз выше, чем у

Page 223: Современные проблемы информатики и вычислительной техники

223 `

USB 2.0. При этом порт USB 3.0 в чипе Exynos 5 Dual может работать в качестве хоста, то есть поддерживается работа с внешними устройствами вроде накопителей, LTE-модемов, клавиатур и мышей. Также заявлена поддержка SATA III.

32-нм чип Exynos 4 Quad в Galaxy S III мог предложить отличную производительность, а Exynos 5 Dual даст ещё больше преимуществ, особенно в области графики. К сожалению, пока Samsung не анонсировала ни одного продукта на базе нового процессора, даже Galaxy Note 10.1 будет работать на чипе предыдущего поколения. Выход первых Cortex-A15 компания ARM недавно пообещала до конца текущего квартала. Таким образом, можно предположить, что в сентябре Samsung может представить новый планшет или смартфон с этим флагманским чипом, который будет одним из лучших вплоть до выхода Tegra 4 и Exynos 5 Quad в следующем году.

Блок-схема Exynos 5 Dual

Page 224: Современные проблемы информатики и вычислительной техники

224 `

11 Современные DSC

11.1 Freescale DSC

Компания Freescale также пошла по пути создания DSC семейства 568000 на базе ядра DSP 56800Е. Сейчас компания выпускает 3 группы DSC семейства 56F8xxx, выполненных на базе ядра 56800Е. 16-битное ядро 56800Е с Гарвардской архитектурой содержит 16×16 умножитель, выполняющий операцию умножения с накоплением за один цикл, 4 32-битных аккумулятора, 32-бит арифметическое и логическое многобитное сдвигающее устройство, 3 адресных шины и 4 шины данных. Векторы прерываний (с пятью уровнями приоритета) могут располагаться в любом месте памяти. Поддерживаются быстрые прерывания, что позволяет в 2…3 раза повысить скорость обработки события.

Самый большой набор периферийных устройств у DSC серии 56F83хх.

Page 225: Современные проблемы информатики и вычислительной техники

225 `

DSC компании находят применение в автомобильных электронных системах (средствах торможения, трансмиссии, стартерах, определения давления шин, управления двигателем); в бытовых устройствах (стиральных машинах, посудомоечных машинах, холодильниках); импульсных и бесперебойных источниках питания; торговых автоматах, измерительных устройствах, системах безопасности, интеллектуальных игрушках.

Page 226: Современные проблемы информатики и вычислительной техники

226 `

11.2 ELVIS

Итак в России ЗАО "МЦСТ" и ОАО "ИНЭУМ им. И.С.Брука" на 9 Международной выставке "ChipExpo-2011г." демонстрируют новые процессоры, персональные компьютеры, ноутбуки и другую электронику работающую на микроэлектронике и процессорах собственного производства.

Компьютеры предназначены в основе своей для: индустрии гражданского производства; военных ведомств России, СНГ и БРИК; радиолокационных систем гражданского назначения (морского, воздушного, наземного транспорта). Для гражданских лиц и бизнеса, где необходимо устанавливать компьютеры особо защищённые и надёжные. Компьютеры имеют разное конструктивное исполнение. Разный класс по защищённости в зависимости от потребности. Все компьютеры имеют поддержку или возможность работы с ГЛОНАСС и GPS, в зависимости от потребностей покупателя.

Итак кратко пройдёмся по новинкам, потом разберём в подробностях и особенностях российских процессоров и как их сравнивать.

11.2.1 Эльбрус-2С+

Эльбрус-2С+ - первый гибридный высокопроизводительный МП фирмы МЦСТ. Он содержит 2 ядра архитектуры Эльбрус и 4 ядра DSP фирмы Элвис. Основная сфера применения процессора Эльбрус-2С+ - системы цифровой интеллектуальной обработки сигнала, такие как радары, анализаторы изображений и т.п.

По сравнению с процессором Эльбрус-S, в процессор Эльбрус-2С+ были введены следующие изменения:

Число ядер архитектуры Эльбрус увеличено до 2.

Кэш-память 2-го уровня уменьшена до 1 МБ на ядро.

Добавлен кластер из 4 ядер DSP, работающих на той же частоте.

Поддерживаемый тип памяти изменён на DDR2-800, пропускная способность улучшилась на 60%

Добавлен ещё один канал ввода-вывода. К нему можно подключить дополнительный южный мост КПИ или специализированное устройство, например контроллер ЦАП/АЦП.

Для гибридного процессора реализована версия компилятора с языка Си, позволяющая компилировать код для ядер DSP и обеспечивать эффективное взаимодействие основной программы, исполняющейся на ядрах CPU, и процедур для DSP.

Основные характеристики системы на кристалле Эльбрус-2C+

Характеристики Значения

Технологический процесс 90 нм

Тактовая частота 500 МГц

Число ядер архитектуры Эльбрус Число ядер DSP (Elcore-09)

2 4

Пиковая производительность (ядра CPU + ядра DSP) 64 разряда, GIPS

20 + 2

Page 227: Современные проблемы информатики и вычислительной техники

227 `

64 разряда, GFlops 32 разряда, GIPS 32 разряда, GFlops 16 разрядов, GIPS

8 + 0 33 + 16 16 + 12 43 + 48

Кэш-память команд (на ядро), КБ 64

Кэш-память данных (на ядро), КБ 64

Кэш-память второго уровня (на ядро), МБ 1

Встроенная память DSP (на ядро DSP), КБ 128

Пропускная способность шины связи с кэш памятью , ГБ/с 16

Пропускная способность шин связи с оперативной памятью , ГБ/с 12,8

Количество каналов межпроцессорного обмена Пропускная способность канала межпроцессорного обмена, ГБ/с Количество каналов ввода-вывода Пропускная способность канала ввода-вывода, ГБ/с

3 4 2 2

Площадь кристалла, мм2 289

Количество транзисторов 368 млн

Количество слоев металла 9

Тип корпуса / количество выводов HFCBGA 1296

Размеры корпуса 37,5х37,5 мм

Напряжение питания, В 1,0 /1,8/2,5

Средняя рассеиваемая мощность ~25 Вт

11.2.2 МЦСТ-4R

Новейший 4 ядерный МП "МЦСТ R1000" («МЦСТ-4R» рабочее название)

Микросхема «МЦСТ-4R» представляет собой 4-ядерную систему на кристалле с встроенными общим кэшем второго уровня, и контроллером когерентности, контроллером канала ввода-вывода, системным

Page 228: Современные проблемы информатики и вычислительной техники

228 `

коммутатором и контроллерами межсистемного обмена. Микросхема построена на базе разработанной ранее в ЗАО «МЦСТ» системы на кристалле «R-500S»

Микросхема и разрабатываемые на ее базе процессорные модули МВС4/С, МВС4-РС предназначены к использованию в совместимых с ВК «Эльбрус-90микро» высокопроизводительных вычислительных комплексах для автоматизированных систем управления, а также для создания высокопроизводительных одноплатных компьютеров носимых и встроенных приложений.

К возможным областям применения микросхемы «МЦСТ-4R» и модулей МВС4/С, МВС4-РС относятся:

Носимые малогабаритные бытовые компьютеры для использования в качестве: компьютера для работы в полевых условиях, в частности для выполнения оперативных расчетов,

хранения справочной информации, подготовки документов различного назначения и др.; терминала радиоэлектронных и связных систем, передвижных и носимых комплексов аппаратуры, терминала контрольно-поверочной аппаратуры на технических позициях, а также в качестве

устройства хранения и подготовки документов, связанных с эксплуатацией сложных комплексов, др. применений.

Компьютеров автоматизированных рабочих мест операторов для использования в качестве средств отображения, документирования выполняемой работы и др.

Встраиваемые управляющие компьютеры для решения задач обработки информации и управления работой специальных объектов в реальном масштабе времени

Класс мобильных отказоустойчивых серверов для построения автоматизированных систем специального .назначения, в частности, АС органов гражданского и военного управления.

Основные характеристики микросхемы «МЦСТ-4R»

Характеристики Значения

Процессорное ядро

Организация ядра – суперскаляр, дешифрация и исполнение до 2 команд за такт. Количество процессорных ядер – 4. Тактовая частота – 1 ГГц.

Производительность, GIPS/GFLOPS 4/1.6

Внутренняя кэш память:

Кэш первого уровня:

команд – 16 Кбайт*,

данных – 32 Кбайт* Кэш второго уровня – 1.5 Мбайт

Оперативная память: Емкость – до 8 Гбайт, Пропускная способность канала – 4.5 Гбайт/с

Канал удаленного доступа к подсистеме ввода вывода:

Количество каналов – 1. Тип канала – дуплексный. Пропускная способность канала в 1 направлении – 2ГБайт/с

Канал межсистемного обмена: Количество каналов – 3 Тип канала – дуплексный Пропускная способность канала в 1 направлении – 2ГБайт/с

Потребляемая мощность, Вт ~10**

Page 229: Современные проблемы информатики и вычислительной техники

229 `

Количество транзисторов, млн. шт. ~150**

Напряжение питания, В 1,0 для внутренних схем, 2,5 и 3, 3 для периферии

Корпус Количество выводов – 900**

Технология КМОП 90 5нм, 8 слоев металла

Площадь кристалла, мм2 ~10х10**

* – данные одного процессора, ** – уточняется в ходе проектированияпп

CPU0 ... CPU3 –4 процессорных ядра;

L2 cache – кэш память второго уровня;

CC – контроллер когерентности

MC – контроллер оперативной памяти DDR2 SDRAM;

IOCC – контроллер канала ввода-вывода;

ISCC – контроллеры межсистемного обмена;

12 Мобильные устройства

12.1 Мобильные и настольные процессоры

Размеры мобильных чипов составляют 12×12 мм, а настольных 45×43 мм. Однако по структуре и принципу работы большинство первых радикально отличаются от вторых. По сути дела, все настольные процессоры от AMD и Intel до сих пор используют разработанную еще в далеком 1978 году (кстати, все той же корпорацией Intel) архитектуру х86 и соответствующий ей набор команд CISC (Complex Instruction Set Computer – компьютер с полным набором команд).

Это означает, что при запуске, скажем, графического редактора процессор отрабатывает всю цепочку команд – он обеспечивает и загрузку всех фильтров, эффектов и прочих функций. Для этого, paзумеется, требуется немалая вычислительная мощность.

Page 230: Современные проблемы информатики и вычислительной техники

230 `

А вот в смартфонах и планшетных ПК, которые, как правило, работают под управлением операционных систем Android или iOS, напротив, используются процессоры типа RISC (Reduced Instruction Set Computer – компьютер с упрощенным набором команд). Именно такие чипы отвечают за значительно меньший объем команд, например при открытии какого-либо приложения они загружают только его основные функции, а необходимые модули подгружают по ходу работы.

Благодаря огромному количеству небольших и точных команд смартфон обеспечивает высокую скорость работы, несмотря на то, что по производительности мобильный процессор значительно уступает настольным. В целом же все мобильные ЦПУ (например, Intel Sandy Bridge) работают медленнее настольных, хотя прямое сравнение производительности затруднительно ввиду больших различий между приложениями для настольных ПК и смартфонов. Быстродействие современных мобильных 2-ядерных процессоров, например Snapdragon S3, находится приблизительно на уровне Intel Atom N550, используемого в нетбуках.

12.1.1 Компоненты мобильных ЦПУ

Мобильные микрочипы состоят из тех же элементов, что и настольные, но у них есть некоторые дополнительные компоненты, поэтому они называются «системами на кристалле» (System on Chip сокращенно SoC).

Количество ядер. Смартфоны и планшеты начального уровня имеют, как правило, лишь 1 процессор с одним ядром, кэш-памятью и контроллером памяти. Устройства среднего и топового класса, напротив, оснащены 2-ядерными процессорами. В самом скором времени ожидается появление процессоров с 4 или 5 ядрами, как на настольных ПК.

Графический процессор. Как и в системах для настольных ПК, вывод изображения на дисплей обеспечивает размещенный на кристалле процессора графический чип.

Процессор обработки изображения. Этот микрочип отвечает за съемку фотографий и видеороликов в смартфонах.

Видеопроцессор. Процессор кодирования и декодирования видеоизображения отвечает за воспроизведение записанных видеороликов.

Аудиопроцессор. Записью звука через микрофон и его дальнейшим воспроизведением через динамики или наушники ведает встроенный в чипсет аудиопроцессор.

12.1.2 Какие задачи выполняет мобильный процессор

Микрочип обеспечивает выполнение всех последовательностей команд на телефоне или планшетном ПК. Например, он выполняет быструю загрузку системы и программ, плавное воспроизведение видео и игр, а также показ фотографий и фильмов. Мобильные процессоры отвечают также за работу всех компонентов, размещенных на системной плате смартфонов и планшетов.

UMTS/WLAN. Данные беспроводные модули установлены на системной плате смартфона или планшетного ПК – они необходимы для подключения к Интернету.

Bluetooth. Этот модуль служит для беспроводного обмена данными между, например, смартфоном и компьютером.

USB-контроллер. Когда пользователь подключает свой планшет к ПК посредством USB-кабеля, центральный процессор устанавливает соединение, используя USB-контроллер.

Кардридер. Микрочип управляет также операциями чтения/ записи данных на карту памяти, например формата microSD.

HDMI. Благодаря этому разъему мультимедийный контент при непосредственном участии процессора попадает со смартфона на телевизор.

Камера. Независимо оттого, что вы снимаете – фото или видео, чип управляет всеми процессами, сопровождающими эти операции.

12.1.3 Миниатюрный размер и низкое энергопотребление

Page 231: Современные проблемы информатики и вычислительной техники

231 `

Производители мобильной техники предъявляют к микрочипам гораздо более высокие требования, чем к настольным процессорам.

Мобильные чипы не должны потреблять много энергии, иначе аккумулятор разрядится уже через несколько часов.

Смартфон или планшетный ПК не допускают установку активного охлаждения (кулера), поскольку имеют слишком тонкий корпус. Посему производители волей-неволей должны выпускать такие чипы, которые выделяют мало тепла.

Толщина токопроводящих соединений в мобильных кристаллах постоянно уменьшается. Это, в свою очередь, благоприятно сказывается на производительности, поскольку на кристалле удается разместить больше транзисторов.

Миниатюрные полупроводниковые элементы пропускают меньший ток, в результате меньше энергии преобразуется в тепло.

Энергопотребление практически не зависит от количества встроенных ядер. Это можно пояснить так: 1-ядерный процессор при воспроизведении HD-видео работает на максимальной тактовой частоте (например, на 1 ГГц), 2-ядерному процессору достаточно для этого 500 МГц. А при работе на низкой частоте современные процессоры способны автоматически снижать рабочее напряжение. Как результат новейшие 2-ядерные процессоры с тактовой частотой 500 МГц выполняют любые операции намного быстрее, потребляя при этом приблизительно столько же энергии, что и 1-ядерные гигагерцевые микрочипы.

12.1.4 Ценовые категории

Здесь действует непреложное правило: чем дороже планшетный ПК или смартфон, тем лучше (мощнее, функциональнее) его процессор.

Начальный класс (5 -10 тыс. руб.). В таких устройствах, как смартфон Р350 Optimus Me от LG или планшет ViewPad 7 от ViewSonic, используются 1-ядерные процессоры, работающие на частоте от 500 до 800 МГц. Микрочипы подобных моделей изготовлены еще по старому техпроцессу 65-нм.

Средний класс (10 - 15 тыс. руб.). К этой категории относится смартфон GT-I9000 Galaxy S от Samsung, который оснащен 1-ядерным процессором, работающим на частоте 1 ГГц. А вот в планшетном ПК Dell Streak 7 установлен уже 2-ядерный процессор NVIDIA Tegra 2 (тактовая частота – 1 ГГц на каждом ядре). В качестве графических решений в устройствах этого класса используются достаточно мощные чипы, например PowerVR SGX540 или GeForce ULP от компании NVIDIA.

Топ-класс (от 15 тыс. руб.). К топовому классу относятся iPhone 4S и планшет iPad 2 от Apple, а также ViewPad Х7 от компании ViewSonic. Все подобные устройства оснащены 2-ядерными процессорами, работающими на тактовой частоте 1 ГГц и выше. За вывод изображения на экран монитора отвечает мощный графический чип, например PowerVR SGX543MP2.

Можно ли использовать мобильные процессоры в настольных ПК?

В настоящее время нет. Они просто не справятся, скажем, с преобразованием видео в подходящий для вас формат. И для обработки фотографий и добавления 3D-эффектов тоже требуется гораздо большая мощь

12.2 Производители мобильных процессоров

Мобильные процессоры состоят из компонентов разных производителей. Главный элемент почти всех моделей – это ЦП на архитектуре ARM. А такие монстры, как Apple или NVIDIA, дополняют их графическими и аудио процессорами, разрабатывают дизайн всего чипа и поручают конечное изготовление другим компаниям.

На мобильном рынке до сих пор доминируют:

Samsung, выпускающий чипы Exynos для собственных смартфонов Galaxy и планшетных ПК, а также А5 для iPad 2 и iPhone 4S,

TSMC, производит процессоры для Qualcomm, NVIDIA и Marvell.

Page 232: Современные проблемы информатики и вычислительной техники

232 `

Компании Intel и AMD, известные своими настольными чипами, на рынке мобильных процессоров представлены в незначительной степени. И хотя они тоже изготавливают мобильные чипы, эти изделия не подходят для мобильных устройств под управлением Android или iOS. В некоторых планшетах, работающих под Windows 7, можно найти процессоры Intel Core і, пример тому – ASUS Еее Slate. То же самое относится и к процессорам Fusion от AMD: и здесь, хотя и редко, встречаются модели под управлением Windows 7, оснащенные этим чипом, например Acer Iconia W500.

Однако планшетные ПК с этой операционной системой используются, как правило, только в корпоративной среде. В настоящее время оба чипмейкера не имеют в своем арсенале подходящих процессоров для смартфонов, но в 2012г. Intel намерена устранить этот изъян, представив новинку под названием Medfield.

Компания же AMD пока не планирует залезать на чужое поле, ограничиваясь производством процессоров для планшетов под управлением Windows: так, новый 2-ядерный Z-03 работает на тактовой частоте 1 ГГц и имеет встроенный графический чип Radeon HD 6250. По имеющимся данным, Z-03 будет доступен к моменту выхода операционной системы Windows 8.

Также стоит упомянуть про процессоры Freescale, модель MXC300-30 – сердце многих современных смартфонов Nokia (E63, E71, 5320, 5800, E51, E75, N97, N81 и др.) ARM11 совместимый процессор на 65нм тех. процессе. Частота процессора – до 532 Мгц. Имеется графичский 2D видеоускоритель.

Компания Intel в 2013г. начнет серийное производство мобильных процессоров ("систем-на-кристалле") нового поколения. Процессоры будут выпускаться по 22-нм техпроцессу. Они будут превосходить чипы нынешнего поколения по быстродействию на 22-65% и по энергопотреблению.

Современные процессоры Intel, предназначенные для смартфонов и планшетов, выпускаются по 32-нм техпроцессу. Компания Qualcomm в производстве своих чипов использует 28-нм техпроцесс, а компания Nvidia - 40-нм.

Intel уже освоила 22-нм техпроцесс, но выпускает по нему только процессоры для компьютеров. В процессорах используются транзисторы 3-D Tri-Gate с тремя затворами. За счет особенностей конструкции утечки тока в Tri-Gate меньше, чем в традиционном транзисторе.

На рынок мобильных процессоров Intel вышла в 2012г., представивила 2 процессора Atom - один для смартфонов, другой для планшетов. Процессоры построены на архитектуре x86, в то время как чипы других компаний - Qualcomm, Nvidia, Texas Instruments - на архитектуре ARM.

Компания Qualcomm смогла на волне популярности смартфонов обогнать Intel по рыночной стоимости. По итогам прошедших торгов капитализация Qualcomm достигла $106 млрд. против $105 млрд. у конкурента в лице Intel. По словам представителя компании, она смогла увеличить объемы продаж благодаря развивающимся рынкам и возросшему спросу со стороны развитых стран.

Intel, в свою очередь, которая не рвалась до последнего времени на рынок мобильных процессоров, страдает от низкого спроса на комплектующие к персональным компьютерам, что сказывается на прогнозах о ее финансовых показателях и стоимости ценных бумаг, Qualcomm оказался в очень выгодном положении и стал основным выгодополучателем в своем сегменте рынка.

Page 233: Современные проблемы информатики и вычислительной техники

233 `

В отчете Qualcomm сообщается, что по итогам третьего квартала текущего года доход на акцию составит 90—98 центов, что больше прогнозируемого показателя в 86 центов.

Уже выдвигаются предположения, что Qualcomm может стать в обозримом будущем «новой Intel».

12.3 Samsung

Основные модели в хронологическом порядке:

S3C 2440 – дата выпуска: 2003г. Частота – 400Мгц, отсутствие аппаратного ускорения ЗD и AVC-видео. Морально устарел. Примеры аппаратного исполнения: Glofish M600, X650,M750,M800,Acer N311.

S3C 6410, S5P6422 – 2008г., соответственно. Несмотря на то, что S5P6422 выполнен по более новому тех. процессу в нем отсутствует графический 3D-ускоритель и чуть ниже частота ядра (533/633 Мгц). S5P6422 – более энергоэффективен. Примеры аппаратного исполнения: Samsung GT-i8000, Samsung B7300, Armani (2), i920 Omnia 2 для первого и Samsung GT-i5800 Galaxy 3, Spica 2 для второго процессора соответственно.

Samsung-Intrinsity S5PC100 – 45-нм процессор ARM Cortex-A8 с частотой 600-800 Мгц. 3D-ускоритель (100MHz). Пример аппаратного исполнения: Iphone 3GS.

Samsung-Intrinsity S5PC110 – 2010г. Поддержка последних ARMv7-инструкций. Мощный графический 3D-ускоритель PowerVR SGX535/540. Аппаратное декодирование HD-видео. VPU-сопроцессор. Одним словом ТОПовый процессор с частотой 1000 Мгц. Примеры аппаратного исполнения: Iphone 3GS, Samsung GT-i9000 Galaxy S, GT-S8500 Wave.

Apple A4 – процессор разработанный фирмой Apple, основан на ядре Cortex A8, имеет частоту 1000Мгц, 512 кб кэша второго уровня и встроенный графический ускоритель PowerVR SGX 535. По сути это переработанный Samsung-Intrinsity S5PC110 (на данный момент подразделение Intrinsity принадлежит Apple). Пример аппаратного исполнения: iPhone 4.

Apple A5 – сравнительно новое детище Apple совместно с Samsung, 2 ядра CortexA9, встроенный графический ускоритель PowerVR SGX. Поддержка FullHD видео. Пример аппаратного исполнения: Apple iPad 2.

Page 234: Современные проблемы информатики и вычислительной техники

234 `

12.4 Intel

Процессоры производства Intel для мобильных ПК - Pentium M или Celeron M, неразрывно связаны с продвигаемой компанией на протяжении нескольких лет интегрированной платформой Centrino для мобильных ПК, включающей в себя лучшие технологии Intel для ноутбуков.

В настоящее время большинство ноутбуков оснащаются процессорами компании Intel, новые версии которых появляются с завидной регулярностью.

Версия технологии энергосбережения от компании Intel получила название Intel SpeedStep, от компании AMD - PowerNow, а от компании Transmeta - LongRun. Эти технологии позволяют сокращать частоту и потребляемое напряжение процессора при работе ноутбука от батареи. При переходе на питание от батареи частота процессора и напряжение питания автоматически снижаются. Снижение рабочей частоты процессора приводит к тому, что приложения, которым требуется максимальная производительность процессора (например, игры), будут работать медленнее. Кроме того, при изменении частоты процессора доступ к памяти временно блокируется, что может привести к проблемам в работе приложений, требующих поточного доступа к памяти (например, для воспроизведения видео). Проблемы в работе таких приложений проявляются в виде артефактов изображения и "выпадения" кадров.

Если Вам необходимо добиться максимальной производительности во время работы от батареи, то придется вручную переопределить или отключить функцию управления энергосбережением.

12.4.1 Pentium M

Это первый процессор компании Intel, созданный специально для использования в ноутбуках. Процессор Pentium M (кодовое имя Banias) был представлен в марте 2003г. вместе с набором микросхем 855 и сетевым адаптером mini-PCIPRO/Wireless2100. Все они входят в группу технологий, объединенную под торговой маркой Centrino.

12.4.2 Платформа Sonoma

В начале 2005г. компанией Intel было представлено второе поколение мобильной платформы Centrino, которое получило название Sonoma. В основе новой архитектуры лежит стремление Intel повысить производительность процессоров, расширить доступные функции ноутбуков и представить более надёжную и производительную беспроводную связь.

В рамках новой платформы было представлено 7 новых процессоров. Все они основаны на ядре Dothan, частота шины FSB которого равна 533 МГц. Кроме того, все эти процессоры отличаются такими параметрами, как производство по 0,09-микронной технологии, поддержка технологии Enhanced SpeedStep и кэш-памяти второго уровня объёмом 2 Мбайт. В платформе Sonoma используется новый набор микросхем Mobile 915 (Alviso), поддерживающий оперативную память стандарта DDR2 с частотой 400/533 МГц.

Ноутбуки на базе процессоров Intel® Core™ эффективно адаптируются к потребностям пользователей, обеспечивая высокую производительность, длительное время автономной работы и исключительную энергоэффективность. Длительное время автономной работы и компактные размеры, позволяющие свободно носить ноутбук с собой в любом месте, помогут вам повысить продуктивность работы. Процессоры Intel® Core™ с технологиями Intel® Turbo Boost ¹ и Intel® Hyper-Threading (Intel® HT)² обеспечивают высокую производительность мобильных ПК и продуктивность работы пользователей благодаря автоматической адаптации к уникальным потребностям каждого пользователя.

Процессоры Intel® Core™ предыдущего поколения обеспечивают высокую производительность, надежность и энергоэффективность настольных ПК.

Intel Core Solo

1-ядерный вариант - чипы Intel Core Solo на ядре Yonah-SC (или Yonah-1P).

Cверхэкономичный вариант 1-ядерных процессоров Intel Core Solo - серия Ultra Low Voltage,

Тип Назначение Ядер Частота Кэш L2/ядро Тех.пр Год Цена TDP

Page 235: Современные проблемы информатики и вычислительной техники

235 `

Core Solo DeskTop 1 1.8 Ггц 2 МB 65-нм 2006 $260 14 - 27 Вт

Core Solo DeskTop 1 1.4 Ггц 2 МB 65-нм 2006 $260 5.5 - 6 Вт

12.4.3 Celeron

Недорогие мобильные ПК.

Высокая безопасность мобильного доступа.

Исключительная экономия.

12.4.4 Intel Atom

Тип Ядро Ядер Частота Кэш L2/ядро Тех.пр Год Цена TDP

Atom DeskTop 1 - 2 1.6 Ггц 0.5 - 1 МB 45-нм 2008. $ 40 -60 4 - 13 Вт

12.4.5 Intel Core2

Intel Core2 Solo

Полная свобода для работы и развлечений дома, в офисе и в поездке.

12.4.6 Intel Core Duo

2-ядерные процессоры Intel Core Duo для мобильных ПК выполнены на базе архитектуры Yonah с соблюдением норм 65 нм технологического процесса.

Page 236: Современные проблемы информатики и вычислительной техники

236 `

Процессоры интересны параллельным исполнением ветвей заданий на 2 ядрах с распределёнными ресурсами процессора, обладают 32 Кб кэша L1 для инструкций и 32 Кб для данных,

кэш-памятью L2 объемом 2 Мб, обеспечивающей эффективное использование кэш-памяти и процессорной шины для повышения производительности 2-ядерной системы и снижения энергопотребления.

Процессоры Intel Core Duo поддерживают оптимизированная по энергопотреблению FSB с частотой до 667 МГц, а также технологию Intel Dynamic Power Coordination с функцией Dynamic Bus Parking для согласования производительности ядер по принципу "по требованию". Технология Intel Dynamic Power Coordination позволяет каждому ядру динамически переходить в состояния Halt, Stop Clock и Deep Sleep, а также синхронно в 2-ядерном режиме – в состояния Deeper и Enhanced Deeper Sleep.

12.4.7 Intel Core2 Quad

Многоядерный процессор, который отлично справляется со сложными вычислительными и графическими приложениями.

Процессоры Intel Core 2 Dou с 2-ядерным дизайном Merom, рассчитанные на работу в мобильных и экономичных ПК, представлены сериями Т и Low Voltage. TDP – энергопотребление за 1 час.

Page 237: Современные проблемы информатики и вычислительной техники

237 `

Intel Core 2 Extreme.

Отличная производительность мультимедиа высокой четкости и многозадачных приложений.

Page 238: Современные проблемы информатики и вычислительной техники

238 `

12.4.8 Intel Core ix

Тип Назначение Ядер Частота Кэш L2/ядро Тех.пр Год Цена TDP

i7 DeskTop 4 3.5 Ггц 8 МB 22-нм 2011 $ 300 - 340 65 - 77 Вт

i5 DeskTop 4 3.4 Ггц 6 МB 22-нм 2010. $235 77 Вт

i3 DeskTop 2 3.3 Ггц 3 МB 45-нм 2011 $125 35 - 55 Вт

12.4.9 Intel и Qualcomm.

Сегодня компания Qualcomm – ведущий игрок на рынке "систем на кристалле" для мобильных устройств (MSoC – mobile system-on-a-chip). По эксперным оценкам пройдёт менее 3 лет и на смену нынешнему лидеру придёт компания Intel.

MSoC – будут оставаться горячей темой в ближайшие 3 года, так что вам предстоит увидеть много прогнозов. Будут и совершенно безумные прогнозы, вроде того, что Intel якобы планирует купить Qualcomm в ближайшее время.

Анализ показывает, что Intel сконцентрируется на создании собственных решений, чтобы занять лидирующие позиции на этом рынке.

В следующем поколении процессоров Atom Intel перейдёт на 22-нм техпроцесс и

технологию FinFET, что равноценно сразу двум шагам в совершенствовании техпроцесса.

Qualcomm собирается перейти с 45-нм на 28-нм техпроцесс (1,5 ступени), но не может

перейти на технологию high-K, а это значит, что придётся пожертвовать тактовой частотой и

энергопотреблением.

Если привести все эти новости к общему знаменателю, то мы видим, что Intel извлечёт

наибольшую выгоду с точки зрения производительности и энергоэффективности от

перехода на новый техпроцесс. Компания Qualcomm, затеявшая азартную игру с 28-нм

техпроцессом на основе технологии "Gate-First", могла бы извлечь пользу от более высокой

плотности транзисторов, но это нивелируется высоким процентом забракованных чипов. Из-

за этого Qualcomm придётся сделать шаг назад и использовать 28-нм техпроцесс на основе

диоксида кремния.

14-нм мобильные процессоры Intel

Intel обещает снизить на 41% энергопотребление процессоров на архитектуре Haswell, которая придёт на смену Ivy Bridge. Версия чипа, предназначенная для ультрабуков и планшетов, будут потреблять 10 Вт вместо 17 в мобильных процессорах предыдущего поколения. Чипы на архитектуре Haswell будут производиться по 22-нм технологии. Производительные мобильные процессоры Intel нового поколения будут потреблять всего 10 Вт. Поставки новых чипов начнутся в первой половине 2013г. года.

С помощью новой энергоэффективной архитектуры Intel надеется закрепиться на рынке тонких ноутбуков и планшетов, где маленькая батарея и пассивное охлаждение не даёт их быстрым и производительным, но прожорливым процессорам возможности конкурировать с экономичными чипами ARM. Более того, крайне низкое потребление процессоров с архитектурой ARM уже позволило им замахнуться на серверный рынок, где традиционно доминирует Intel.

Натиск ARM-процессоров вынуждает компанию Intel работать активнее, чтобы не потерять свой рынок и не сдаться захватчикам, в том числе и AMD. Так что ей приходится разрабатывать все новые и новые процессоры. Речь идет о серии процессоров Broadwell, предназначенных для мобильных устройств и выполненных по суперсовременной технологии.

Чипы будут производиться по новейшей 14-нм технологии, гарантирующей высокую производительность готового продукта при незначительном нагреве и минимальном потреблении энергии. Вот только когда мы их увидим-то? Хотелось бы, конечно, побыстрее, но ждать нам как минимум до 2014 года, поскольку в следующем году стартуют продажи 22-нм мобильных процессоров Haswell. К ним относятся и Core 4 поколения, и, возможно, Atom. Напомним, что в них реализован новый способ расположения транзисторов – теперь не только горизонтальный, но еще и вертикальный. С учетом того, что даже в 22-нм CPU будет очень мощная видеокарта с поддержкой DirectX 11, то от 14-нм моделей можно ждать чего-то еще более продвинутого и интересного. Как ожидается, чипы Intel

Page 239: Современные проблемы информатики и вычислительной техники

239 `

Broadwell будут производиться в корпуса BGA или Ball Grid Array, то есть об их использовании в десктопах фактически можно забыть. Вероятнее всего, они нацелены на ноутбуки и планшетные компьютеры.

Несмотря на свои скромные размеры, мобильные процессоры, предназначенные для смартфонов и планшетных компьютеров, демонстрируют поразительную мощность. Центральное процессорное устройство (ЦПУ) – «сердце» современного смартфона и планшетного компьютера. Хотя по размеру оно не больше ногтя большого пальца, по производительности такой микрочип практически ни в чем не уступает своему десктопному собрату, который в тринадцать раз больше.

Но как работает это настоящее чудо инженерной мысли? Каковы отличия между миниатюрными процессорами для смартфонов и планшетных компьютеров и их настольными аналогами? Какие инновации в этой области ожидают нас в самое ближайшее время?

12.5 AMD

Гибридные процессоры поколения Trinity предназначены для использования в ноутбуках.

Процессоры Trinity сочетают вычислительные ядра (2 или 4) с архитектурой Piledriver и графическую подсистему На монолитном кристалле, выпущенном по 32-нм технологии, расположились 1,3 млрд. транзисторов. Площадь ядра Trinity равна 246 кв.мм – это больше, чем у предшественника Llano (228 кв.мм). Процессоры Ivy Bridge в 4-ядерной версии имеют площадь кристалла 160 кв.мм и содержат 1,4 млрд. транзисторов.

Технология Turbo Core 3.0 позволяет динамически разгонять как вычислительные ядра, так и графические. Процессоры Trinity в исполнении Socket FS1 ревизии 2 поддерживают 2-канальную память типа DDR3-1600, значение TDP не превышает 35 Вт. Процессоры с пониженным энергопотреблением в исполнении Socket FP2 поддерживают память типа DDR3-1333 и характеризуются значением TDP не более 17 или 25 Вт, в зависимости от модели. Характеристики представленных сегодня мобильных процессоров Trinity приведены ниже:

A10-4600M. Radeon HD 7660G, 4 ядра, частота ядер 2.3 / 3.2 ГГц, 4 Мб кэша второго уровня, 384 потоковых процессора, частота графической подсистемы 497/686 МГц, исполнение Socket FS1;

A8-4500M. Radeon HD 7640G, 4 ядра, частота ядер 1.9 / 2.8 ГГц, 4 Мб кэша второго уровня, 256 потоковых процессоров, частота графической подсистемы 497/655 MГц, исполнение Socket FS1;

A6-4400M. Radeon HD 7520G, 2 ядра, частота ядер 2.7 / 3.2 ГГц, 1 Мб кэша второго уровня, 192 потоковых процессора, частота графической подсистемы 497/686 МГц, исполнение Socket FS1;

A10-4655M. Radeon HD 7620G, 4 ядра, частота ядер 2.0 / 2.8 ГГц, 4 Мб кэша второго уровня, 384 потоковых процессора, частота графической подсистемы 360/497 MГц, исполнение Socket FP, TDP не более 25 Вт;

A6-4455M. Radeon HD 7500G, 2 ядра, частота ядер 2.1 / 2.6 ГГц, 2 Мб кэша второго уровня, 256 потоковых процессоров, частота графической подсистемы 327/424 МГц, исполнение Socket FP, TDP не более 17 Вт.

Последние две модели ориентированы на использование в сверхтонких ноутбуках, которые станут конкурировать с ультрабуками на основе процессоров Intel. В режиме покоя ноутбук на базе процессора Trinity способен проработать до 12 часов от одного заряда батареи. Цены на мобильные процессоры AMD традиционно не упоминаются, но в сегменте сверхтонких решений компания ставит задачу уложиться в стоимость всей системы не более $499-599.

AMD mobile.

Тип Ядро Ядер Частота Кэш L2/ядро Тех.пр Тр./ядро Год Цена TDP

Radeon 1 1 Ггц 2 МB 65-нм 150 млн. 2006г. 5.5 - 6 Вт

Trinity 1 1.8 Ггц 2 МB 65-нм 150 млн. 2006г. 27 Вт

Page 240: Современные проблемы информатики и вычислительной техники

240 `

12.6 Texas Instruments

12.6.1 Ti OMAP

Линейка процессоров этого вендора весьма многочисленная, но она разделена на поколения:

1 поколение (напр. TiOMAP750, 800, 1510, 1710) ,

2 поколение (напр. TiOMAP2420, 2430),

3 поколение (напр. Ti OMAP 3430),

4 поколение существует пока только на бумаге.

1 поколение: 2003г.-1004. Частота процессоров до 264Мгц. Поддержка инструкций ARMv5 (у старших моделей). А том, что он давно устарел, думаю, говорить не стоит. Примеры аппаратного исполнения: Rover S6, HTC Touch, Pharos, Herald, Gene, Rover R5, S7, Asus P526,P527, Nokia 3230,6260,6620,6670, 6680, 6630, 6681, N70, N90, 3250, E50, 5500, E61, E62, E65, E70, N71, N73, N75, N80, N90, N91, N92. 2 поколение: 2005г.-1006. Частота процессоров до 330-450Мгц. Сниженное энергопотребление. Встроенный DSP-сопроцессор на 220Мгц. Графический 2D/3D ускоритель. ARM11 архитектура. Примеры аппаратного исполнения: Nokia E90, Nokia N93, Nokia N95, Nokia N82, N810, N800, Motorola RZR Z10, Samsung GT-i8510, GT-i7110, i550, i560, G810, i400, i520, Asus M536. 3 поколение: 2008г. Еще более сниженное энергопотребление и частота в 800 Мгц на 65нм тех. процессе. Поддержка ARMv7 инструкций. Встроенный DSP-сопроцессор на 430Мгц. Графический 3D-ускоритель PowerVR SGX. Семейство Snapdragon разработано на основе Ti OMAP 3, при этом его превосходит. Примеры аппаратного исполнения: Apple iPod touch (3GS), Apple iPhone 3GS, Motorola Droid, Palm Pre, Samsung i8910, Sony Ericsson Satio, Nokia N900.

12.6.2 Изменение приоритетов

TI собирается сменить приоритеты на рынке электроники и заняться в первую очередь промышленными клиентами, например, автопроизводителями. Этот сектор бизнеса расценивается компанией как более стабильный и прибыльный по сравнению с сектором мобильных устройств, смартфонов и планшетных компьютеров. В ближайшем будущем TI планирует «ослабить хватку» в секторе мобильных платформ.

В последнее время компании TI приходится жестко конкурировать с такими серьезными игроками, как Qualcomm и учитывать тот факт, что даже крупные производители готовой мобильной продукции вроде Apple и Samsung предпочитают разрабатывать собственные чипы вместо того, чтобы заказывать их у партнеров.

Процессоры TI OMAP долгое время использовались в смартфонах Motorola, они установлены в планшетных компьютерах Amazon Kindle Fire и даже в смартфоне Samsung Galaxy Nexus. Однако, начиная с настоящего момента, компания перестанет выделять ресурсы на поддержку клиентских устройств, вроде смартфонов и планшетов в той мере, в какой это было прежде. Ранее компания уже была вынуждена оставить попытки использовать свои стандартные чипы OMAP на информационно развлекательных системах для автомобилей.

12.7 ARM

Мобильные чипсеты (процессоры), основанные на архитектуре ARM – сердце большинства смартфонов, КПК и коммуникаторов. Огромный модельный ряд мобильных устройств и особенности региональных рынков сбыта привели к тому, что разобраться в линейке ARM-процессоров того или иного вендора обычному обывателю практически нереально. Но мы попробуем (в обзоре представлены только распространённые процессоры с архитектурой ARM).

12.8 Qualcomm

Основные модели в хронологическом порядке:

MSM7200(A) - дата выпуска: 2006г. Отличия: повышенная с 400Мгц до 528Мгц у MSM7200A частота, новый тех. процесс и сниженное энергопотребление, наличие встроенного 3D-ускорителя Ati Imageon.

Page 241: Современные проблемы информатики и вычислительной техники

241 `

Ускорение видео аппаратными средствами возможно только в стандартном Windows Media Player. Примеры аппаратного исполнения MSM7200: HTC TyTN II, HTC Nike, HTC Touch Cruise, HTC Touch Dual и MSM7200A: SE Xperia 1,2, HTC Hero, Diamond 2, Pro 2, Gsmart S1200, Samsung GT-i7500 MSM7225 – 2007г. По характеристикам MSM7225 тот же MSM7200A, без аппаратного видеоускорителя, со сниженным энергопотреблением. Примеры аппаратного исполнения: HTC Touch 2, HTC Touch Cruise 2009г., 3G, HTC Wildfire, HTC Tattoo, Highscreen Zeus, Acer E101, E200.

MSM7201A – 2008г. Еще более сниженное энергопотребление и задел для разгона со стандартных 528Мгц. Встроенный FPU-блок для ускорения вычислений. Графический 2D/3D–ускоритель. Примеры аппаратного исполнения: HTC Diamond, HTC Touch HD, Pro, HTC Dream, HTC Magic, Motorola Z6, HTC MAX 4G.

MSM7227 - Отличия от MSM7225 значительные: 3D-ускоритель Adreno200 (OpenGL 2.0), более мощный DSP-сопроцесcор, Блок FPU, наличие кэша второго уровня. По производительности процессор ближе к новому поколению QSD - Qualcomm Snapdragon. Примеры аппаратного исполнения: HD Mini, GSmart G1305, HTC Aria, LG GT540 Optimus, HTC Legend, SE X10 mini.

QSD MSM 8250/8650 – 2007г. Процессор первого Snapdragon поколения с поддержкой ARMv7 инструкций. Мощный DSP-сопроцессор, работающий на частоте 600Мгц. Стандартная частота процессора – 1000МГц. Передовой мобильный 3D-ускоритель Adreno200. Примеры аппаратного исполнения: Toshiba TG02, Acer Stream S110, Liquid, HTC Desire, SE Xperia X10, HTC HD2 QSD MSM 8255/8655 – 2010г. Snapdragon второго поколения. Сниженный до 45нм тех. процесс, сниженное энергопотребление и более высокая производительность. Мобильный 3D-ускоритель Adreno205, работающий в среднем раза в 2 быстрее Adreno200. Поддержка 3G-скоростей до 14.4 Мбит/с. Примеры аппаратного исполнения: Desire S, Incredible, Desire HD, Sony Ericsson Arc. QSD MSM8260/8660 – конец 2010г. Snapdragon – третье поколение. 2 ядра – 1.2 Ггц. Новый 3D-ускоритель Adreno220. Примеры аппаратного исполнения: HTC Sensation.

QSD MSM8672 – разновидность предыдущего процессора с более высокой частотой процессора – 1.5Ггц. MSM8930/ MSM8960/ APQ8064 – 2011г Snapdragon 4 поколения. 3 модели с 1, 2 и 4 ядрами соответственно. Видеоускорители: Adreno225, Adreno305, Adreno320 соответственно. Сниженный до 28нм тех. процесс. Поддержка декодирования FullHD-видео, поддержка 3D, LTE сетей (4G).

Page 242: Современные проблемы информатики и вычислительной техники

242 `

13 Системы на кристалле

Система на кристалле (СнК) — электронная схема, выполняющая функции целого устройства (например, компьютера) и размещенная на одной интегральной схеме.

В англоязычной литературе называется System-on-a-Chip, SoC.

В зависимости от назначения она может оперировать как цифровыми сигналами, так и аналоговыми, аналого-цифровыми, а также частотами радиодиапазона. Как правило, применяются в портативных и встраиваемых системах.

Если разместить все необходимые цепи на одном полупроводниковом кристалле не удается, применяется схема из нескольких кристаллов, помещенных в единый корпус (System in a package, SiP). SoC считается более выгодной конструкцией, так как позволяет увеличить процент годных устройств при изготовлении и упростить конструкцию корпуса.

Типичная СнК содержит:

один или несколько микроконтроллеров, микропроцессоров или ядер DSP,.

банк памяти, состоящий из модулей ПЗУ, ОЗУ, ППЗУ или флеш.

источники опорной частоты, например, кварцевые резонаторы и схемы ФАПЧ (фазовой автоподстройки частоты),

таймеры, счетчики, цепи задержки после включения,

блоки, реализующие стандартные интерфейсы для подключения внешних устройств: USB, FireWire, Ethernet, USART, SPI.

блоки цифро-аналоговых и аналого-цифровых преобразователей.

регуляторы напряжения и стабилизаторы питания.

В программируемые SOC часто входят также блоки программируемых логических матриц - ПЛМ; а в программируемые аналого-цифровые SOC - еще и программируемые аналоговые блоки.

Блоки могут быть соединены с помощью шины собственной разработки или стандартной конструкции, например AMBA в чипах компании ARM. Если в составе чипа есть контроллер прямого доступа к памяти (ПДП), то с его помощью можно заносить данные с большой скоростью из внешних устройств напрямую в память чипа, минуя процессорное ядро.

Разработка систем-на-кристалле.

Для функционирования системы программное обеспечение не менее важно, чем аппаратное. Разработка, как правило, ведётся параллельно. Аппаратная часть собирается из стандартных отлаженных блоков, для сборки программной части используются готовые подпрограммы настройки соответствующих блоков, реализующие необходимые процедуры и функции, которые в англо-язычной литературе часто называются драйверами. Применяются средства автоматизации разработки CAD и интегрированные программные оболочки.

Для того, чтобы удостовериться в правильной работе созданной комбинации блоков, драйверы и программу загружают в эмулятор аппаратной части (микросхему с программируемыми цепями, FPGA). Также требуется задать расположение блоков и разработать межблочные связи.

Перед сдачей в производство аппаратная часть тестируется на корректность с использованием языков Verilog и VHDL, а для более сложных схем — SystemVerilog, SystemC и OpenVera. До 70 % общих усилий на разработку затрачивается именно на этом этапе.

Системы-на-кристалле потребляют меньше энергии, стоят дешевле и работают надёжнее, чем наборы микросхем с той же функциональностью. Меньшее количество корпусов упрощает монтаж. Тем не менее, создание одной большой и сложной системы на кристалле оказывается более дорогим процессом, чем серии из маленьких, из-за сложности разработки и отладки и снижения процента выхода годных изделий.

Список компаний, разрабатывающих СнК ниже.

Altera.

Page 244: Современные проблемы информатики и вычислительной техники

244 `

14 Встраиваемые решения

Встроенная система (embedded system) — специализированная МП система управления, концепция разработки которой заключается в том, что такая система будет работать, будучи встроенной непосредственно в устройство, которым она управляет.

Устройство строится на базе встроенного компьютера, который в то же время не воспринимается пользователем устройства как компьютер (так как не имеет обычного монитора и клавиатуры, не отображает привычной ОС и другого ПО.

В связи с тем, что система управления будет размещаться внутри более сложного устройства, при её разработке ключевую роль играют следующие факторы:

минимальное собственное энергопотребление (возможно автономное питание);

минимальные собственные габариты и вес;

собственная защита (корпус) минимальна и обеспечивается прочностью и жёсткостью конструкции и применёнными элементами;

функции отвода тепла (охлаждения) обеспечивают минимум требований тепловых режимов. Если плотность теплового потока (тепловой поток, проходящий через единицу поверхности) не превышает 0,5 мВт/см², перегрев поверхности устройства относительно окружающей среды не превысит 0,5 °C, такая аппаратура считается нетеплонагруженной и не требует специальных схем охлаждения.

Микропроцессор и системная логика, а также ключевые микросхемы по возможности совмещены на одном кристалле

Специальные военно-космические требования по радиационной и электромагнитной стойкости, работоспособность в вакууме, гарантированное время наработки, срок доступности решения на рынке и т. д.

Основой построения простых встроенных систем часто служат МК, специализированные или универсальные МП. Для построения некоторых видов встроенных систем широко используют микропроцессоры архитектуры ARM.

Областью применения встроенных систем являются:

Средства автоматического регулирования и управления техпроцессами, например авионика, контроль доступа.

станки с ЧПУ.

банкоматы, платёжные терминалы.

телекоммуникационное оборудование.

Рынок встраиваемых процессоров может вырасти до размеров в 10 раз больших, нежели экосистема мобильных чипов.

Как сообщил Уоррен Ист, исполнительный директор ARM Holdings, пусть мобильные устройства остаются прибыльным направлением для его компании, пришло время развивать и другие виды бизнеса.

По оценке руководителя, где-то через 5 лет ежегодно будет продаваться 3-5 млрд. планшетов, смартфонов, цифровых телевизоров и ПК. Рынок встраиваемых систем, представленный автоматизацией производства, цифровыми идентификационными комплектами, запоминающими устройствами сверхбольших объемов и автомобильным оборудованием, за тот же периоод времени способен достичь реализации 30-40 млрд/ единиц в год.

Статистика это подтверждает: в первом квартале 2012г. количество поставленных ARM-процессоров, предназначенных для потребительских и встроенных устройств, выросло на 15% — до 800 млн. Тогда как число отгруженных чипов для мобильных телефонов и компьютеров осталось почти неизменным в сравнении с прошлым годом — 1,1 млрд.

Безопасность встроенных систем. Некоторые встроенные системы используются в массовых количествах (например, устройства RFID). Встроенные системы являются привлекательной целью для создателей вредоносного кода из-за своей распространённости и относительной беззащитности. Постепенно возникает вредоносный код для встроенных систем (например, RFID-вирус Cabir). К счастью,

Page 245: Современные проблемы информатики и вычислительной техники

245 `

этот процесс пока затрудняется разнородностью встроенных устройств, отсутствием доминирующего ПО и ограниченной функциональностью некоторых видов устройств. С другой стороны, задача антивирусных компаний и исследователей компьютерной безопасности также осложнена этими обстоятельствами, а также маломощностью встроенных систем, зачастую не позволяющей пользоваться распространённым антивирусным ПО.

ЦПУ для встраиваемых систем. Могут использоваться очень многие из современных МП и МК. Конкретный вид определяется при проектировании, исходя из целей и задач выполняемых встраиваемой системой.

14.1 Intel

В рамках сложившейся традиции игроки рынка аппаратных решений для встраиваемых систем практически одновременно с официальной премьерой 3 поколения Intel Core анонсировали ряд продуктов на основе этих процессоров.

2 поколение Intel Core, известное как Sandy Bridge, произвело настоящий фурор на рынке встраиваемых систем — многих впечатлил стремительный штурм позиций конкурентов в традиционно консервативном сегменте высокопроизводительных систем оборонного и аэрокосмического назначения, где прежде господствовали решения иных производителей.

В соответствии с принципом чередования производственных и архитектурных новаций, принятым на вооружение корпорацией в 2007г., 3 поколение Ivy Bridge от Intel Core знаменует собой начало масштабного внедрения на предприятиях Intel процесса с нормой производства 22-нм и трехмерных транзисторов (рис. 1). Собственно, в этом и состоит главное, но не единственное отличие Ivy Bridge от процессоров Sandy Bridge, выполненных по технологии 32-нм с применением обычных планарных транзисторов. Усовершенствование производственного техпроцесса позволило уменьшить площадь кристалла до 160 кв. мм против 216 кв. мм соответственно у сопоставимых 4-ядерных вариантов Ivy Bridge и Sandy Bridge. Одновременно были увеличены плотность размещения и общее количество транзисторов на кристалле — 1,4 млрд. против 1,16 млрд. Следствием перехода на более прогрессивную технологию производства стали также существенное снижение энергопотребления процессоров Ivy Bridge и увеличение их производительности по сравнению с Sandy Bridge. В целом, по оценкам независимых экспертов, технологические новации обеспечили 3 поколению Intel Core общий прирост вычислительной мощности примерно до 20%, производительности в расчете на 1 ватт потребляемой электроэнергии — до 40%.

Эволюция полупроводниковых технологий, используемых в процессорах Intel (2003г–2012г):

Многие специалисты отмечают, что сегодня на рынок встраиваемых систем все глубже проникают технологии массового применения для потребительского и корпоративного рынка, обеспечивающие передовые показатели производительности и энергоэффективности вкупе с сокращением циклов разработки и снижением стоимости решений.

Page 246: Современные проблемы информатики и вычислительной техники

246 `

Исходя из этого, платформа Ivy Bridge представляется логичным выбором для широкого спектра приложений, ориентированных на различные вертикальные рынки, в том числе и те, где архитектура от Intel ранее не применялась. Совмещая архитектурные достоинства Sandy Bridge с преимуществами перехода на более тонкий техпроцесс, что выражается в дальнейшем росте производительности и энергоэффективности, процессоры 3 поколения Intel Core еще выше поднимают планку возможностей встраиваемых систем.

Существует внушительный пласт встраиваемых приложений, которым всегда требуется наивысшая доступная на рынке производительность вычислений, обработки сигналов и графических операций, в сочетании с максимально возможной пропускной способностью каналов связи. К таким приложениям относятся в первую очередь высокопроизводительные интеллектуальные системы, проектируемые для нужд оборонной и аэрокосмической отраслей, а также системы ЦОС для сферы телекоммуникаций и решения для работы с графическими данными, применяемые в промышленности и медицине. Для всех этих задач платформа Ivy Bridge представляется логичным выбором.

Не следует забывать и о том, что на кристалле Ivy Bridge располагается более мощное графическое ядро, которое может включать до 16 исполнительных устройств (у Sandy Bridge — 12) и поддерживает графические интерфейсы DirectX 11, OpenGL 3.1, OpenCL 1.1. И при этом площадь кристалла, как уже было отмечено, уменьшилась. Среди приложений, которым усовершенствованные функции 3 поколения Intel Core необходимы в первую очередь, специалисты отмечают, в частности, системы обнаружения (радары, сонары), системы связи, устройства видеообработки, а также медицинские системы компьютерной диагностики. Вместе с тем, исходя из аналогичных соображений, высоким потенциалом для применения платформы Ivy Bridge обладают и другие вертикальные рынки — информационно-развлекательные, транспортные системы, решения для ретейла, игровые автоматы, системы оповещения и рекламы и т. д.

Коммуникационные возможности платформы Ivy Bridge также существенно улучшены по сравнению с Sandy Bridge.

Page 247: Современные проблемы информатики и вычислительной техники

247 `

На уровне процессора реализована поддержка до 16 линий PCI Express 3.0 (эта технология обеспечивает вдвое большую пропускную способность по сравнению с PCIe 2.0, позволяя, к примеру, использовать в составе решений современные видеоплаты старшего класса и задействовать высокоскоростные интерфейсы для внешних коммуникаций 10-Gigabit Ethernet и 40-Gigabit Ethernet).

Рынок встраиваемых компьютерных технологий в его сегодняшнем виде не только не препятствует, но пока благоволит тому, чтобы потенциал применения систем на основе процессоров 3 поколения Intel Core раскрылся в полной мере, тем более что предыдущим поколением был создан достаточно неплохой задел. На данный момент именно продуктовая линейка Ivy Bridge олицетворяет собой венец процессорных технологий Intel для разработчиков встраиваемых решений. И такая ситуация сохранится до той поры, когда неумолимая логика закона Мура приведет корпорацию Intel к выпуску процессоров следующего поколения на основе микроархитектуры Haswell.

14.2 Freescale

Компания Freescale является мировым лидером в области производства полупроводниковых компонентов для встраиваемых систем и устройств телекоммуникаций для крупных и динамично развивающихся рынков. В настоящее время основными сферами интересов компании являются автомобильная электроника, коммуникационные и графические приложения, беспроводная связь. Лидирующие позиции компании Freescale в различных секторах индустрии подтверждаются статистикой:

Занимает 2 место по поставкам МК для автомобильной электроники и является мировым лидером среди поставщиков датчиков для подушек безопасности.

Находится на 1 месте на рынке автомобильных акселерометров и на 3 месте среди поставщиков автомобильных датчиков.

Занимает 1 место на рынке коммуникационных процессоров и встроенных процессоров для сетевых технологий.

Является лидером по поставке процессоров и приложений для электронных книг.