Журнал "Системы Безопасности" № 6‘2024

Ц И Ф Р О В А Я Т Р А Н С Ф О Р М А Ц И Я , И И , И Н Т Е Р Н Е Т В Е Щ Е Й 126 Р ассмотрим технологии, которые появились только в прошлом году и уже стали незамени- мыми. Text2Music: будущее контента на основе ИИ Весной 2024 г. появились сервисы, которые по текстовой подсказке могли создавать музыку и видеоролики. Они достаточно быстро прошли путь от концептов до вполне продуктовых реше- ний. Например, Melobytes, AIVA и Suno позво- ляют превращать текстовые описания в музы- кальные композиции в разных стилях, и вы можете буквально за пару минут написать впол- не качественную песню в стиле рок на стихи Пушкина, от вас при этом не потребуется ника- ких профессиональных навыков. И хотя подобным решениям нет еще и года, AIVA уже активно применяется для создания фоновой музыки к короткометражным филь- мам, а Melobytes интегрируется в маркетинго- вые кампании. Эти технологии делают музы- кальное творчество доступным для всех. Text2Video: перезагрузка видеоконтента Text2Video преобразует текстовые сценарии в видеоролики с использованием передовых алгоритмов, основанных на представлении ней- росетью латентных пространств. Эти технологии позволяют анализировать текст и создавать визуальный контент, используя сложные моде- ли, которые интерпретируют данные как мно- жество взаимосвязанных атрибутов. Kapwing, Modelscope AI, Sora и Kling – одни из лидеров в этой области. Например, Sora генери- рует видеоконтент, основываясь на концепции персонализированного подхода, анализируя предпочтения пользователя и предлагая уни- кальный визуальный ряд. Kling использует схо- жую архитектуру, предоставляя инструменты для создания интерактивных видео, где пользова- тельские данные включаются в динамическую анимацию. Эти подходы активно применяются в образовании, маркетинге и создании контента для социальных сетей, что раньше требовало существенных ресурсов продакшн-команд. Хотя точные данные о числе созданных в 2024 г. видео неизвестны, технологии Text2Video уже доказали свою ценность, предлагая решения, которые значительно упрощают процессы кон- тент-генерации, помогая создавать эффективные решения для маркетинга, обучения и блогинга. Apple Vision Pro: смешанная реальность нового уровня В 2024 г. мы уже писали о выходе Apple Vision Pro – виртуального шлема, реализующего кон- цепцию пространственного компьютера. Он принципиально изменил подход к взаимодей- ствию с цифровым контентом, задав новый стандарт качества. Устройство активно исполь- зуется в архитектуре и медицине, например для 3D-моделирования зданий или симуляций хирургических операций. По оценкам, оно уже заняло 5% рынка устройств для виртуальной реальности. Широкому распространению пока мешают высокая цена и отсутствие приложе- ний, которые помогли бы в полной мере вос- пользоваться его техническими возможностя- ми. Но есть слухи, что Apple работает над более дешевой альтернативой. Несмотря на отсутствие точных данных о коли- честве реализованных проектов, Vision Pro стал универсальным инструментом для профессио- налов и любителей, устраняя барьеры между физическим и цифровым пространством. Гуманоидные роботы и LLM: новые стандарты автоматизации В 2024 г. снова появился интерес к роботам-гума- ноидам, связанный с тем, что теперь они оснаще- ны большими языковыми моделями (LLM), – это позволяет перейти от их программирования к обучению, давая им возможность легко интегри- роваться в повседневную жизнь. Tesla со своим проектом Optimus, а также Figure AI с моделями Figure 01 и Figure 02 активно продвигают это направление. Tesla Optimus демонстрирует улуч- шенную подвижность и способность к выполне- нию рутинных задач, включая работу на про- изводственных линиях и помощь в быту. Figure AI представила модели Figure 01 и Figure 02, которые применяются в логистике, склади- ровании и розничной торговле. Эти роботы уже проходят тестирование на таких предприятиях, как завод BMW в Спартанберге, демонстрируя высокую эффективность. Хотя конкретные данные о масштабах их при- менения в 2024 г. недоступны, все эти роботы успешно решают задачи, требующие точности и автоматизации, что помогает оптимизировать рабочие процессы. Logical Reasoning Models: интеллект, способный мыслить Летом 2024 г. OpenAI представила новый вид моделей Logical Reasoning Models (LRM), которые являются эволюцией LLM-моделей o1-mini, o1-preview. LRM – это новый тип искусственного интеллекта, способный рас- суждать и принимать решения на основе сложных данных. Он используется в задачах, где требуется анализ большого количества факторов и построение причинно-следствен- ных связей. Например, модели OpenAI серии o1 активно применяются для автоматизации сложных процессов, таких как анализ боль- шого объема данных в реальном времени. В тестовом режиме OpenAI o1 продемонстри- ровала способность строить сложные логиче- ские выводы в задачах прогнозирования рыночных трендов и анализа юридической документации. Благодаря своей способности к логическому мышлению LRM превосходит обычные чат- боты, которые ограничиваются стандартными скриптами. В реальных приложениях он используется для оценки кредитных рисков, анализа юридической документации или соз- дания стратегий в области инвестиций. Это делает его ключевым инструментом для отрас- лей, где критически важны точность и надеж- ность решений. Ключевое преимущество LRM – это способ- ность адаптироваться и использовать логиче- ские правила, имитируя человеческое мыш- ление. Например, в банковском секторе он помогает автоматизировать процесс кредит- ной оценки, учитывая множество перемен- ных, таких как кредитная история, рыночные условия и экономические показатели. Эти модели активно внедряются крупнейшими мировыми банками, что подтверждает их надежность и эффективность в реальной практике. Используя LRM, исследователи смогли предска- зать результаты выборов в США еще в сентябре (309:229 – прогноз, 312:226 – реальность) на основе моделирования поведения основных групп населения. В декабре OpenAI анонсиро- вала новое поколение моделей o3, которые по тестам значительно превосходят o1 и могут решать научные задачи на уровне доктора наук. Некоторые исследователи даже считают, что это уже AGI-модели, то есть общий искусственный интеллект. Опубликовать их для общего доступа планируют в I квартале 2025 г. декабрь 2024 – январь 2025 www.secuteck.ru Алексей Коржебин Эксперт проекта "Системы безопасности", редактор раздела "Цифровая трансформация, ИИ, Интернет вещей" Главные технологические достижения 2024 года: прорыв к будущему 2024 год стал эпохой вдохновляющих технологических открытий, раздвинул границы возможного и перевернул представления о взаимодействии с цифровым миром. Каж- дое достижение этого года не просто впечатляет, оно прокладывает путь к еще более захватывающему будущему, вдохновляя на новые свершения.