30.01.2025 06:10
750
![](/bitrix/templates/freepixel_template/images/news-view.png)
В "Яндексе" рассказали о возможной ошибке китайского чат-бота
![В "Яндексе" рассказали о возможной ошибке китайского чат-бота В "Яндексе" рассказали о возможной ошибке китайского чат-бота](/upload/resize_cache/iblock/b39/300_0_1/g76t906z0dce0wufolv17nzguv90pge9.jpg)
Недавно стало известно, что данные, связанные с технологиями "Яндекса", могли быть включены в дата-сет для обучения нейросети DeepSeek.
Из-за этого возникла ситуация, когда китайский чат-бот случайным образом произносит информацию, относящуюся к российской компании, и ошибочно утверждает, что он является YandexGPT. Об этом сообщили в пресс-службе "Яндекса" РИА Новости.
Появление скриншотов с ответами DeepSeek на вопрос о том, кто умнее - он или ChatGPT4, вызвало широкий резонанс в Telegram-каналах. На скриншотах видно, как китайский чат-бот сначала утверждает, что он является YandexGPT, а затем объясняет, что это было всего лишь недоразумение, вызванное технической ошибкой в данных или случайной путаницей во время обучения.
Этот инцидент поднял вопрос о безопасности и конфиденциальности данных, используемых для обучения и развития искусственного интеллекта. Как можно избежать подобных ситуаций в будущем и обеспечить точность и надежность работы нейронных сетей - это вызов, перед которым стоит весь мир технологий.
Нейросети часто обучаются на разнообразных данных из интернета, включая как оригинальные тексты, так и материалы, созданные другими искусственными интеллектами. Возможно, в дата-сет DeepSeek попали данные, связанные с технологиями "Яндекса", так как в сети активно обсуждаются и упоминаются подобные системы. По мнению представителей "Яндекса", это может объяснить случайное включение информации о компании в ответы модели, даже до утверждения, что она является YandexGPT.
Изучение и использование данных из интернета для обучения нейросетей становится все более распространенной практикой. Однако, это может привести к нежелательным результатам, когда модели случайным образом включают в ответы информацию, которая не соответствует действительности. В случае с DeepSeek, возможно, произошло именно такое искажение из-за наличия данных о "Яндексе" в исходном дата-сете.
Компании, разрабатывающие искусственный интеллект, должны быть особенно внимательны к источникам данных, которые используются для обучения моделей. Недостаточная фильтрация информации может привести к нежелательным последствиям, как в случае с упомянутой моделью, которая ошибочно ассоциировала себя с YandexGPT из-за случайного включения данных о "Яндексе".
Важность обучения ИИ-моделей не ограничивается простым запоминанием фактов - они также должны учитывать стиль и контекст информации. Это позволяет моделям глубже понимать данные, с которыми работают. Кроме того, при использовании русскоязычного DeepSeek вероятность включения информации, связанной с "Яндексом", увеличивается, благодаря популярности продуктов компании.
"Появление новой модели на рынке подчеркивает важность развития открытых решений. Мы в "Яндексе" активно поддерживаем развитие open source и считаем, что важно содействовать открытым разработкам и технологиям, доступным для всего сообщества", - подчеркнули в компании. Это свидетельствует о стремлении к совершенствованию и доступности технологий для всех.
Таким образом, сотрудничество и развитие в области искусственного интеллекта становятся ключевыми аспектами в современном мире. Поддержка открытых разработок и обучение моделей с учетом контекста - это необходимые шаги для создания эффективных и инновационных решений в области ИИ.
Новая версия ассистента на базе искусственного интеллекта от компании DeepSeek, основанной в Китае, была выпущена 20 января. Согласно информации на сайте компании, этот ассистент R1 не уступает по функционалу ChatGPT. После обновления приложения, ассистент DeepSeek сразу возглавил рейтинги в различных странах. Например, в магазине приложений Apple - App Store - он стал лидером в США, Великобритании, ОАЭ, Японии, Южной Корее и Китае. Этот успех подтверждает высокую оценку пользователей и их заинтересованность в новом продукте.
Источник и фото - ria.ru