ua ru
Пожалуйста, заполните это поле
1

Искусственный интеллект GPT стремительно эволюционирует и поражает новыми возможностями

Технологии 13:21 - 16 марта 2023

Возможности и скорость прогресса систем искусственного интеллекта могут одинаково поражать и пугать

Логотип OpenAI на смартфоне

OpenAI представила улучшенную версию ChatGPT/Фото: Levart_Photographer/Unsplash

Если вас каким-то чудом не поражают темпы современного технологического прогресса, то просто осознайте, что уже вышел искусственный интеллект GPT-4. Прошло всего несколько месяцев после выхода ChatGPT, поразившего весь мир, а перед нами уже усовершенствованная более умная и более точная версия, поражающая новыми возможностями.

Детали

Компания OpenAI выпустила существенное обновление "мозга", которое стоит за ее феноменальным ИИ ChatGPT. GPT-4 был обучен на эпически огромной облачной суперкомпьютерной сети, объединяющей тысячи графических процессоров, специально разработанных и созданных в сочетании с Microsoft Azure. Удивительно, но набор данных, который использовался для его обучения, не обновлялся – поэтому, хотя GPT-4 кажется значительно умнее GPT-3.5 (ChatGPT), он также не знает о том, что произошло с сентября 2021 года. И хотя он сохраняет полный контекст определенного разговора, он не может обновлять свою основную модель и "обучаться" по разговорам с другими пользователями.

Там, где GPT-3.5 мог обрабатывать текстовые вводы длиной до 4096 токенов (или около 3000 слов), GPT-4 запускается с максимальной длиной контекста 32 768 токенов (или около 24 600 слов). Теперь он может принимать до 50 сплошных страниц текста и переваривать их для вас за считанные секунды.

В тесте "HellaSwag", предназначенном для количественной оценки "умных рассуждений по поводу ежедневных событий", модель GPT 2019 года набрала 41,7%, а недавняя модель GPT-3.5 — 85,5%. GPT-4 набрал впечатляющие 95,3%. Люди, к нашей чести, в среднем набирают 95,6%, но вряд ли нам удастся долго удерживать лидерство здесь.

С точки зрения фактической точности, он получил примерно на 40% более высокую оценку по собственным тестам "фактичности" OpenAI в девяти различных категориях. Он также значительно лучше справляется со многими экзаменационными работами, которыми его предшественник уже поразил нас. Взяв единственный адвокатский экзамен как экстремальный пример, он прыгает с 10-го процентиля до 90-го процентиля, если сравнивать его со студентами-людьми.

Он значительно менее склонен к выдаче неправильных сведений, которые в OpenAI называют галлюцинациями. При этом GPT-4 все еще выдает от 20% до 30% мусорных фактов. Этот аспект в дальнейшем будет совершенствоваться, но это само по себе создает интересную проблему: чем более фактически правильным становится сервис искусственного интеллекта, тем больше людей научатся ему доверять и полагаться на него, а следовательно, тем большими будут последствия ошибок.

Выход за пределы текста

GPT-3.5 был заперт в мире букв, цифр и слов. Но он не очень похож на реальный человеческий мир, в котором часто более визуальные стили общения передают сообщения гораздо ярче и понятнее.

Итак, как объявила Microsoft, GPT-4 является "мультимодальным" – способным обрабатывать другие медиа-файлы, а также просто текст. Но хотя Microsoft говорит о потенциальных вариантах использования видео и аудио, OpenAI ограничил GPT-4 только приемом изображений при запуске.

Тем не менее его возможности в этой области представляют головокружительный скачок в будущее. Он может просматривать входные данные изображений и получать от них откровенно потрясающий объем информации, демонстрируя то, что OpenAI называет "подобными возможностями, как и для ввода только текста". Во время сравнительного тестирования он, кажется, опережает ведущие визуальные искусственные интеллекты, особенно когда речь идет о понимании графиков, диаграмм и инфографики – все это может стать ключевым для того, чтобы сделать его настоящей машиной для обобщения длинных отчетов и научных исследований.

Но он может сделать гораздо больше, чем это. Он может смотреть на мемы и пытаться объяснить вам, почему они смешны, очерчивая не только то, что на фото, но и общую концепцию, более широкий контекст и то, что преувеличено или неожиданно. Наконец-то, вы можете не смущаться в компании друзей и просто попросить искусственный интеллект объяснить шутку.

Фото: OpenAI

GPT-4 также может посмотреть на фотографию и предусмотреть движение предметов на ней, когда произойдет определенное действие, что может показаться пониманием физики, но на самом деле он не понимает физику. Он также не понимает шуток и мемов, как и его предшественник, он вообще ничего не понимает. GPT-4 просто анализирует данные, которые ему дает человек-собеседник и пытается дать ответ наиболее похожий на тот, который мог бы дать человек.

На момент запуска вы можете получить доступ к визуальным возможностям GPT только через одно приложение: Be My Eyes Virtual Volunteer — это приложение для смартфонов для слепых и слабовидящих, которое позволяет им фотографировать окружающий мир и запрашивать у GPT полезную информацию.

We are thrilled to present Virtual Volunteer™, a digital visual assistant powered by @OpenAI’s GPT-4 language model. Virtual Volunteer will answer any question about an image and provide instantaneous visual assistance in real-time within the app. #Accessibility #Inclusion #CSUN pic.twitter.com/IxDCVfriGX

— Be My Eyes (@BeMyEyes) March 14, 2023

Но Be My Eyes показывает только вершину того, что эта мультимодальная разработка может сделать, когда вы начинаете комбинировать режимы. Президент и соучредитель OpenAI Грег Брокман нарисовал следующее изображение, дополненное почерком врача.

Фото: OpenAI

Затем он сфотографировал его и загрузил в GPT-4 с запросом "напишите короткий HTML/JS, чтобы превратить этот макет в красочный веб-сайт, где указания вставить шутки заменены двумя настоящими шутками". За считанные секунды он сделал именно это, продемонстрировав, что может прочитать и понять его почерк, понять, как должен был работать веб-сайт и в каком формате он должен быть, придумать образец содержимого и написать код для создания рабочей веб-страницы, которая работает именно так, как вы ожидаете.

Фото: OpenAI

Конечно, это довольно грубый пример, но попробуйте сами сделать это за несколько секунд (на самом деле, не пробуйте – вам не удастся). В какой-то момент в ближайшем будущем GPT сможет создавать полностью реализуемые веб-сайты на основе подобных эскизов, от функционального внутреннего кода до графического дизайна и написания всего текста для вас.

Команда OpenAI также сделала GPT-4 более международным и теперь этот ИИ работает точнее не только на английском, но и на других языках.

Конечно всех пугает то, что скорость и точность ИИ, такого как GPT может лишить людей рабочих мест, но еще более угрожающими являются его возможности по созданию пропаганды, дезинформации, невероятно точного и эффективного спама. Он может одинаково эффективно планировать день и террористические атаки, рассказывать как создавать взрывчатку, совершать самоубийство или преследовать других, а особенности кодирования делают его идеальным для создания всех видов вредоносного программного обеспечения.

Поэтому OpenAI бросила массу рабочей силы, чтобы вручную попробовать как можно больше очистить модель GPT-4, прежде чем открыть двери для общественности, ограничив непристойный, враждебный, незаконный или насильственный язык и понятия, а также диапазон случаев использования, определенный командой OpenAI как "вредный" или "рискованный".

Ранее мы сообщали, что южнокорейская компания DeepBrain создала программу, позволяющую общаться с умершими людьми. Искусственный интеллект формирует образ человека и может общаться от его имени.

Источник: New Atlas

Не пропустите интересное!

Подписывайтесь на наши каналы и читайте новости в удобном формате!

Главное за сегодня
Больше новостей