Исследователи Массачусетского Института Технологии показали свою новую разработку – BlueDBM– схему взаимодействия в сети серверов с использованием флэш-памяти вместо обычной RAM. Такая система показывает высокую эффективность при работе с приложениями «больших данных».
Изначально представленная на Международном симпозиуме по компьютерной архитектуре, новая система настолько же эффективна, насколько и сервера, работающие c обычной RAM, в то же время обеспечивая экономию энергии и затрат.
Исследователи MIT попробовали интегрировать флэш-память вместо обычной RAM для работы с приложениями bigdata, поскольку флэш-память примерно в 10 раз более дешева, и примерно во столько же раз меньше потребляет энергии.
«Процессор берет данные из оперативной памяти в десятки тысяч раз быстрее, чем с диска, но в век «больших данных» наборы данных становятся слишком большими, чтобы поместиться в ОЗУ любого компьютера. Например, данные человеческого генома заняли бы ОЗУ примерно 40-100 компьютеров», - говорит представитель MIT.
Исследователи рассчитали, что если система, обрабатывающая данные в памяти, обращается к жесткому диску хотя бы 5% времени, то производительность падает из-за этого настолько, как если бы вместо обычной RAM использовалась флэш-память. Тогда исследователи создали сеть из 20 серверов, соединенных с FPGA (field-programmable gate array) – программируемой логической матрицей, которая представляет собой чип, который может «вести себя» как различные типы микросхем. Каждая FPGA была соединена с двумя флэш-дисками на 500 гигов, и с двумя другими FPGA, ближайшими в серверной стойке. Поскольку все FPGA были соединены между собой, они сформировали очень быструю сеть, которая позволила любому серверу извлекать данные с любого флэш-диска. FPGA также использовали алгоритмы, которые предварительно обрабатывали данные, хранящиеся на флэше.
Сотрудники MIT протестировали систему на трех популярных типах big-data приложений: поиск изображений, оценка качества информации на веб-страницах (примерно аналогично тому, что делает алгоритм Google PageRank) и кэширование информации базы данных, к которой часто требуется доступ.
Предполагается, что подобная схема может быть использована в различных приложениях, поскольку FPGA могут быть перепрограммированы под другие задачи, в зависимости от приложения.
«В результате мы получаем распределенную вычислительную систему, которая теряет очень мало в сравнении с традиционным дизайном, в то же время дает колоссальную экономию энергии и затрат», - говорят в MIT.
По материалам Inquirer