Журнал "Системы Безопасности" № 3‘2024

Ц И Ф Р О В А Я Т Р А Н С Ф О Р М А Ц И Я , И И , И Н Т Е Р Н Е Т В Е Щ Е Й 118 Р анее для реализации голосового режима использовалась отдельная модель, перево- дящая голос в текст и обратно и передающая этот текст на вход ChatGPT, и, соответственно, терялись такие параметры голоса, как тембр, громкость, эмоциональность и т.д. Это событие обещает изменить наше представ- ление о взаимодействии с искусственным интеллектом, делая его еще более естествен- ным и доступным, стирая грань между общени- ем людей и машин. К сожалению, мы можем пока судить только по видеороликам, представ- ленными OpenAI, и ждем возможность попро- бовать вживую в ближайшие недели. Кино предсказывает будущие технологии Чтобы представить, на что это похоже, можно вспомнить культовые фильмы – "Космическая Одиссея 2001 года" и его знаменитый искус- ственный интеллект HAL 9000, который мог общаться голосом с экипажем корабля, выпол- нять их команды и даже принимать сложные решения, и фильм "Она" (Her), где искусствен- ный интеллект Саманта становится не просто ассистентом, а полноценным собеседником и другом для главного героя. В фильме "Она" искусственный интеллект демонстрирует способность понимать и отве- чать на человеческие эмоции до такой степени, что главный герой влюбляется в ИИ. Скачок вперед GPT-4o – это не просто обновление, это скачок вперед UI-/UX-общения с пользователем. Если раньше работа с голосовым режимом была похожа на работу полудуплексной радиостан- ции (когда говорит или отвечает только один и нужно ждать полного ответа от модели, чтобы задать новый вопрос), то сейчас полное ощуще- ние телефонного разговора: модель значитель- но снижает задержку при голосовых запросах, что обеспечивает плавное и мгновенное взаи- модействие. Поддержка более 50 языков делает модель универсальной и доступной для людей из раз- ных уголков планеты и фактически создает уни- версальный голосовой переводчик. Более того, голос модели может быть эмоциональным, менять тембр, скорость и другие параметры, а также быть мужским или женским. Она может даже напевать, добавляя интерактивность и креативность в общение. С GPT-4o общение с искусственным интеллек- том стало как никогда естественным. Пред- ставьте, что вы можете задавать вопросы и получать ответы в режиме реального време- ни, используя голосовые команды. Модель распознает интонации, понимает контекст и отвечает так, будто вы разговариваете с живым человеком. Например, вы можете спросить, как приготовить любимое блюдо, и получить пошаговую инструкцию, не отвле- каясь от готовки. Давайте рассмотрим некоторые варианты при- менения, которые сильно могут изменить соот- ветствующие отрасли и рынки. Образование GPT-4o может стать незаменимым помощником в обучении, а в некоторых случаях и заменить преподавателя. Представьте студента, который готовится к важ- ному экзамену. Вместо сухого заучивания мате- риалов он может общаться с GPT-4o, задавая сложные вопросы и получая подробные объ- яснения. Это интерактивное обучение помогает лучше понять и усвоить материал. Кроме того, GPT-4o может помогать в изучении иностран- ных языков, демонстрируя корректное произно- шение и исправляя ошибки. Все чаще студенты университетов или школьники прямо на лекции уточняют информацию, которую дает учитель. GPT-4o может также помочь с тестированием процесса усвоения материала, придумывая задания и объясняя ошибки. Модель может быть замечательным инстру- ментом и для учителей: одна моя знакомая учительница английского таким образом гото- вит задания для уроков, например написать 100 предложений во времени Present Perfect или составить шуточный диалог между Гарри Поттером и Волан-де-Мортом, где бы исполь- зовались условные предложения второго и третьего типов; другой знакомый, логопед, с помощью GPT-4o пишет небольшие стишки для малышей, где прорабатываются опреде- ленные звуки. Воспитание детей GPT-4o может стать полезным инструментом для родителей и учителей в общении с детьми. Модель может помогать детям в обучении, отвечая на их вопросы и объясняя сложные кон- цепции простым языком. Кроме того, GPT-4o может создавать интерактивные истории, под- держивая интерес детей к чтению и развитию воображения. Например, модель может приду- мать историю о супергерое, который учит детей чистить зубы. Во время вечерних игр с детьми GPT-4o может стать настоящим другом для всей семьи. Например: "Привет, ребята! Готовы к вечерней сказке? Сегодня я расскажу вам о приключе- ниях храброго пиратского капитана. А после этого можно поиграть в новую игру, которую я придумал специально для вас!" Голос не толь- ко развлекает, но и обучает детей, делая вре- мяпрепровождение дома более увлекатель- ным и познавательным. Бизнес В бизнесе GPT-4o становится очень полезным инструментом, упрощая и ускоряя рутинные задачи. Представьте себе аналитика, который с помощью голосовых команд может запросить анализ рыночных данных и получить отчет в считанные секунды, не запрашивая програм- мистов, которым для реализации такого отчета потребуются дни или даже недели. Руководите- ли могут использовать модель для планирова- ния встреч, создания презентаций и проведения переговоров. Все это сделает работу более эффективной и продуктивной. Туризм Туриндустрия может существенно выиграть от внедрения GPT-4o. Представьте, что вы находи- тесь на экскурсии, а вместо гида вас сопровож- дает голосовой помощник, который отвечает на все ваши вопросы о достопримечательностях: "Добро пожаловать в Париж! Вы сейчас нахо- дитесь у Эйфелевой башни, построенной в 1889 г. Хотите узнать больше о ее истории или, возможно, получить советы по лучшим местам для фотографий?" ИИ-помощник предложит интерактивные сюжеты, например игры или викторины, делая экскурсии более увлекательными и информа- тивными. Кроме того, предложенная информа- ция будет значительно более достоверной и полной, чем у любого гида. Ритейл В сфере ритейла GPT-4o сможет заменить про- давца-консультанта. Представьте себе магазин, где вы, подойдя к любому товару, зададите вопрос голосовому ассистенту: "Подскажите, какой состав у этого продукта и как его лучше использовать?" или "Какие скидки сейчас дей- ствуют на эту одежду?" июнь – июль 2024 www.secuteck.ru Алексей Коржебин Эксперт редакции журнала "Системы безопасности" GPT-4o: Революция в голосовом взаимодействии с искусственным интеллектом С момента своего появления ChatGPT завоевал сердца миллионов пользователей по всему миру. Недавно OpenAI анонсировала очередное революционное обновление – новый голосовой режим работы и модель GPT-4o, для которой голос – это лишь один тип мультимодальных данных, наравне с текстом и изображениями

RkJQdWJsaXNoZXIy Mzk4NzYw