IBM представляет революционную технологию оптической передачи данных, которая обеспечивает «световую скорость» обучения искусственному интеллекту
IBM успешно разработала новую оптическую технологию, которая может поддерживать обучение моделей искусственного интеллекта со «скоростью света», экономя при этом значительную энергию.
IBM разработала новую оптическую технологию, которая может помочь обучать модели искусственного интеллекта со «скоростью света», одновременно экономя значительную энергию. IBM заявляет, что благодаря применению этих новых достижений в центрах обработки данных энергия, сэкономленная при обучении типичной модели ИИ, эквивалентна годовому потреблению энергии 5000 домохозяйствами в США.
По данным IBM, хотя центры обработки данных подключаются к внешнему миру с помощью оптоволоконных кабелей, медные провода по-прежнему являются преобладающим материалом, используемым внутри. Эти медные провода отвечают за подключение ускорителей графического процессора, которые при использовании питания тратят много времени на ожидание данных от других устройств, что существенно увеличивает эксплуатационные расходы. Комментируя новую технологию оптической передачи данных, Дарио Хил, старший вице-президент и директор по исследованиям IBM, сказал:
Поскольку ИИ создает потребность в большей мощности и вычислительной мощности, центры обработки данных должны развиваться, а универсальная технология корпусной оптики может помочь крупномасштабным центрам обработки данных лучше адаптироваться к будущим требованиям. Благодаря этому прорыву процессоры будущего будут взаимодействовать так же, как оптоволоконные кабели передают данные в центры обработки данных и из них, открывая новую эру более быстрых и устойчивых коммуникаций, способных обрабатывать огромные рабочие нагрузки искусственного интеллекта.
IBM представляет революционную технологию оптической передачи данных, которая обеспечивает «световую скорость» обучения искусственному интеллекту. Рисунок 1
IBM описывает свой новый прототип комплексной оптики (CPO) в техническом документе. По сути, за счет значительного увеличения пропускной способности в центрах обработки данных можно свести к минимуму время простоя графического процессора, ускоряя обработку ИИ.
IBM утверждает, что эта технология может сократить время обучения большим языковым моделям (LLM) с трех месяцев до трех недель. В то же время повышение энергоэффективности позволит сократить потребление энергии и снизить затраты, связанные с обучением LLM.
Дэвид Пак
Обновление от 12 декабря 2024 г.