При перепечатке материалов просим публиковать ссылку на портал Finversia.ru с указанием гиперссылки.
Китайский технологический гигант в области электронной коммерции представил новые модели искусственного интеллекта, способную анализировать изображения и вести более сложные диалоги, сообщается в пятничном объявлении компании. Эта модель стала ответом на возрастающую конкуренцию в глобальной гонке за лидерство в области обладания и контроля технологиями искусственного интеллекта.
Alibaba представила две новые модели - Qwen-VL и Qwen-VL-Chat. Оба этих продукта будут доступны с открытым исходным кодом, что позволит исследователям, разработчикам, учёным и компаниям по всему миру использовать их для создания собственных приложений искусственного интеллекта без необходимости обучения систем с нуля, что, в свою очередь, экономит время и ресурсы.
По словам представителей Alibaba, модель Qwen-VL способна отвечать на запросы, связанные с различными изображениями, и создавать подписи к ним. В то время как модель Qwen-VL-Chat обладает возможностью более «сложного взаимодействия», такого как сравнение нескольких введенных изображений и ответы на несколько раундов вопросов. Среди прочих функций Qwen-VL-Chat - написание историй и генерация изображений на основе введенных пользователем фотографий, а также решение математических уравнений, представленных в виде изображений.
Пример использования, приведенный Alibaba, заключается в распознавании вывески больницы на китайском языке. Модель способна отвечать на вопросы о расположении конкретных отделений больницы, анализируя изображение вывески.
До этого большая часть генеративного искусственного интеллекта, который создаёт ответы на основе действий человека, ориентировалась на текстовую информацию. Новые модели Alibaba, а также последняя версия ChatGPT от OpenAI, имеют способность анализировать изображения и предоставлять текстовые ответы.
Обе последние модели Alibaba основаны на большой языковой модели компании под названием Tongyi Qianwen, представленной в начале этого года. Эта модель, основанная на обширных массивах данных, является основой для создания чат-ботов и других приложений искусственного интеллекта.
В этом месяце компания, базирующаяся в Ханчжоу, также предоставила доступ к исходному коду для ещё двух моделей искусственного интеллекта. Такой подход, лишенный лицензионных ограничений, поможет Alibaba привлечь больше пользователей к своим продуктам искусственного интеллекта, особенно в условиях, когда её облачное подразделение стремится к расширению и планирует IPO.
Материалы на эту тему также можно прочитать:
- Alibaba launches AI model that can understand images and have more complex conversations (CNBC)
обсуждение