Понедельник, 23.12.2024
×
Фондовый рынок с Ольгой Коношевской - 22.12.2024

Павел Шпидель: О научно-технической революции…

Аа +
- -

Способен ли ГИИ ускорить научно-технический прогресс?

Вы часто в новостях слышите: «ГИИ открыл новые материалы с невиданной скорость, создал новые лекарства, изобрел ракетный двигатель». Все это фейк из-за непонимания нюансов работы технологии.

Изначально сделаю разделение на продукты (ChatGPT, Claud, Gemini и другие) и технологию, на которой базируется ГИИ. С продуктами все понятно – это забавная игрушка, имеющая околонулевую практическую ценность и нулевой научно-технический потенциал, но с технологией иначе и не все так однозначно.

Наука – это сложная система, включающая изучение причинно-следственных связей, а также механизмов взаимодействия объектов и процессов.

ГИИ – это лишь инструмент, базирующийся на совершенно иной технологии, которая не может быть напрямую применима к R&D.

С точки зрения науки ГИИ помогает работать с неструктурированными массивами информации, искать корреляции и зависимости, обеспечивать классификацию данных и создавать пространство векторов/вероятностей.

Например, лично в своих исследовательских проектах я использую связку Excel + Python + SQL + комплекс дата провайдеров по финансовой и экономической статистике + Google/Yandex, которые были заменены на связку ChatGPT/Perplexity.

ChatGPT/Perplexity работают в связке для поиска актуальной информации, как решить какую-то проблему или задачу в программировании, настройке ИТ комплексов, разработке формулы или как навигатор по инструкциям/гайдам/мануалам + очень редко в классификации неструктурированных массивов данных.

Как показывает опыт, ГИИ имеет нулевую ценность в аналитике данных и научно-исследовательских проектах – пользы действительно нет, но как более эффективная замена Google и Wikipedia – да. Конспектирование / экстракт отчетов с использованием ГИИ (основная функция у них) редко провожу.

Поэтому, когда вижу, что ГИИ создал ракетный двигатель – это просто смех от вопиющей тупости журналистов. Даже в микромодуле для простых расчетов ГИИ налепит десятки ошибок, которые придется исправлять три часа, а сложные и многофакторные проекты – тут даже речи не идет.

Весь раздутый хайп вокруг ГИИ действительно выглядит необоснованным.

• Проблема в критически низкой точности выходных результатов, что абсолютно неприемлемо для научных расчетов и проектов, где требуется подтвержденная качественная информация (юриспруденция, финансы и страхование, медицина и т.д.).

• ГИИ регулярно галлюцинирует (в будущем этот баг можно минимизировать, хотя полностью исключить не получится).

Низкая надежность приводит к тому, что к любой выходной информации ГИИ относишься с недоверием, что требует времени и ресурсов для проверки и верификации, что снижает производительность.

LLM производят низкокачественную и ненадежную информацию, которая затем всасывается обратно в другие LLM. Модели становятся необратимо загрязненными.

• Современные большие языковые модели (LLM) научились распознавать шаблоны/паттерны, но не понимают лежащие в их основе концепции и причинно-следственные связи, поэтому они изначально тупы, хотя чисто технически «эрудированы» из-за концентрации данных. LLM обучают на наборе доступных данных — тексте, изображениях и аудио, а не на прямом взаимодействии с физическим миром.

• Модели могут отражать предвзятости и перекосы в данных, на которых они обучались. Обучение на доступных данных приводит к тому, что модели не могут выйти за пределы предоставленной информации и сделать выводы на основе реального опыта или экспериментов. Это ограничивает их способность к инновациям и приспособлению к новым и неожиданным ситуациям.

• Ограниченная длина контекстного окна, что приводит к утрате нити повествования или «забывании» исходных корректировок.

• Ограниченность масштабирования и отсутствие самообучения в публичных моделях.

• Нет критерия оценки выходных данных (нет критерия ошибки), поэтому ГИИ не может эффективно управлять вектором генерации результатов.

Технологии совершенствуются очень быстро, особенно быстро масштабируемые ИИ технологии. То, что казалось невозможным вчера, может быть реальностью в ближайшем времени.

Сложно сказать, к чему нас заведет этот тернистый ИИ путь?

Область применения очень ограниченная, если вывести из анализа бытовое применение и концентрировать внимание исключительно на коммерческом применении.

Переводчики, редакторы, корректоры, копирайтеры и новостные журналисты, художники, дизайнеры, аниматоры, программисты, операторы колл-центров, консультанты, офисные работники/секретари, рекламные менеджеры. Многие профессии под угрозой трансформации частичной или полной.

И все же, если говорить именно о потенциале научно-технического прогресса и R&D, здесь я скептик.

Если опустить продукты (ChatGPT, Claud, Gemini и другие), которые в науке действительно полный ноль в плане положительного эффекта, а рассматривать технологию, можно выделить:

• Вариационные автокодировщики (VAE)
• Генеративные состязательные сети (GAN)
• Графовые нейронные сети (GNN)
• Рекуррентные нейронные сети (RNN)
• Сверточные нейронные сети (CNN).

Каждая из нейросетей может быть полезна в какой-то области, но подчеркну – лишь как дополнение и надстройка к существующим научно-исследовательским проектам и комплексам.

Например, в сегменте биотехнологиях очень популярны TensorFlow и PyTorch (библиотеки для построения и обучения моделей глубокого обучения, применяемых в том числе в химии), которые используются много лет и являются частью ИИ.

CellDesigner для моделирования биохимических сетей и COPASI для моделирования и анализа биохимических систем, GROMACS для молекулярной динамики и так далее.

В аэродинамике и аэрокосмическом проектировании применяются научно-исследовательские комплексы в вычислительной гидродинамике (CFD) такие как ANSYS Fluent и NASA's FUN3D. В аэродинамическом моделировании - XFLR5, в термодинамическом моделировании - ANSYS Thermal, для оптимизации конструкций – OptiStruct, для общих математических расчетов – комплексы MATLAB и т.д.

Какие программные и научные комплексы используются в финансовом моделировании, статистике и макроэкономическом анализе?

R, Python, MATLAB, SAS и Excel для расчётов, автоматизации, статистического анализа и программировании. TensorFlow и PyTorch для машинного обучения, Tableau, Power BI, D3.js и Excel для визуализации и так далее.

В чем суть? Под каждую задачу свой комплекс. В реальном мире научные комплексы учитывают физику объектов и их взаимодействие, молекулярное и химическое моделирование на основе целого комплекса моделей.

ГИИ из-за архитектурных особенностей не может применяться для моделирования – это вообще другая область и класс задач, но ГИИ может классифицировать и в каком-то смысле анализировать полученные результаты при моделировании, создавая вектор распределения и пространство решений.

Еще раз, ГИИ не создает технологии, это в принципе невозможно даже теоретически. ГИИ может участвовать в создании технологии, лишь как дополнение к существующим комплексам с множеством допущений (высокая вероятность ошибок).

В этом смысле я не вижу ничего, чтобы могло качественно ускорить технологический прогресс. С 2023 не появилось ничего принципиально нового. Машинное и глубокое обучение существует уже несколько десятилетий и активно применяется в R&D.

Telegram канал автора: https://t.me/s/spydell_finance/

В разделе «Обзор блогов» редакция представляет републикации наиболее интересных постов известных российских экономистов, публицистов, финансистов и экспертов, опубликованных на личных каналах и онлайн-ресурсах авторов. Ссылки на эти ресурсы указаны под обзором. Данные републикации не являются подготовленными специально для Finversia.

Ответственность за информацию, высказанные профессиональные и этические оценки, версии и прогнозы остается на авторах блогов.

Орфография и пунктуация авторов блогов сохранена. Перевод иноязычных блогов – авторы блога.

Заметили ошибку? Выделите её и нажмите CTRL+ENTER
все обзоры блогов »
- -
77
ПОДПИСАТЬСЯ на канал Finversia YouTube Яндекс.Дзен Telegram

обсуждение

Ваш комментарий
Вы зашли как: Гость. Войти через
Канал Finversia на YouTube

календарь эфиров Finversia-TV »

 

Корпоративные новости »

Blocks_DefaultController:render(13)