Xiaohu демонстрирует межмодельный рабочий процесс: GPT для генерации изображений + Gemini 3.1 Pro для преобразования в интерактивный 3D-контент

Китайский AI-наблюдатель xiaohu 10 мая поделился примером рабочего процесса, сочетающего GPT и Gemini 3.1 Pro: сначала с помощью GPT генерируются изображения, затем Gemini 3.1 Pro преобразует изображения в 3D-интерактивный контент, который можно превратить в научные приложения с возможностью вращения и управления на любую тему знаний. Пример, показанный xiaohu в твите, включает демонстрацию 3D-планет, интерактивные научные модели и т.д. — это конкретная практика «межмодельного рабочего процесса» (multi-model workflow).

Структура рабочего процесса: GPT генерирует изображение → Gemini 3.1 Pro делает 3D-версию

Весь рабочий процесс состоит из двух этапов:

Этап первый: с помощью GPT (GPT-image-1 или встроенная в ChatGPT генерация изображений) получить тематическое изображение и обеспечить визуальную основу

Этап второй: ввести изображение в Gemini 3.1 Pro, после чего Gemini преобразует 2D-изображение в 3D-интерактивный контент

Формат вывода: 3D-объекты, которыми можно вращать, масштабировать и взаимодействовать прямо в браузере

Подходящие сценарии: научное образование, продуктовые презентации, интерактивный контент по знаниям

«Межмодельный рабочий процесс» — одна из ключевых тенденций AI-приложений на 2026 год: больше не существует «единственной модели на все случаи», разработчики связывают самые сильные стороны разных моделей и создают приложения, которые недоступны одному-единственному моделю.

Конкретная демонстрация: 3D-планеты, интерактивный научный контент, сайт-роботизированная торговая точка

Несколько примеров, которые xiaohu публикует параллельно:

Демонстрация 3D-планет: вращаемая Солнечная система или модель одной планеты

Интерактивный научный контент: абстрактные знания превращаются в 3D-визуализации, подходящие для обучения

Будущий сайт торгового автомата с роботами: с генерацией изображений через GPT и платформой Tripo 3D сделать демонстрационный веб-сайт

Общая черта всех этих примеров — «визуальная генерация + интерактивное преобразование»: GPT отвечает за творческую визуальную часть, а Gemini или другие 3D-инструменты — за перевод статичных изображений в управляемые интерактивные формы. Каждый сегмент по отдельности не считается новым, но итоговый пользовательский опыт после сквозного соединения сильнее, чем у любого отдельного инструмента.

Значение: межмодельные рабочие процессы постепенно становятся стандартной моделью разработки

Конкретные выводы для разработчиков:

Правильно выбрать инструменты важнее, чем выбрать «самую сильную модель» — GPT силён в визуальной части, Gemini — в многомодальном понимании, Claude — в длинном context, у каждой есть свои «сладкие точки»

Стоимость интеграции через модельные API снижается, и состыковка нескольких моделей на уровне реализации становится выполнимой

Новые типы приложений, вероятно, будут «мульти-модельными pipeline», а не расширением идеи «самой сильной единственной модели»

Ценность этого примера — не в технологическом прорыве, а в шаблоне дизайна рабочего процесса

Конкретные события, которые можно будет отслеживать далее: будет ли Google в последующих активностях официально объявлять 3D-возможности Gemini 3.1 Pro как продуктовую функцию, будут ли межмодельные рабочие процессы получать шаблоны поддержки по умолчанию в таких фреймворках, как LangChain / LlamaIndex, и какие существуют конкретные примеры внедрения в коммерческих кейсах (например, образование, e-commerce, маркетинг).

Эта статья, где xiaohu показывает межмодельный рабочий процесс: GPT генерирует изображения + Gemini 3.1 Pro преобразует их в 3D-интерактивный контент, впервые появилась в ChainNews ABMedia.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Alibaba Cloud запускает план с командными токенами с 10+ моделями уже сегодня

Согласно Beating, сегодня Alibaba Cloud запустила свою программу Team Token Plan, предлагая подписки на 10+ крупных языковых моделей, включая Qwen 3.6, Kimi-K2.6, GLM-5.1 и Wan 2.7. Пользователи могут гибко переключаться между моделями для генерации кода, синтеза изображений и других задач. Версия для команды отличается от персональных тарифов возможностями корпоративного управления. Администраторы могут управлять распределением мест, отслеживать использование и устанавливать бюджетные ограничен

GateNews2ч назад

Дунгуань поставит половину глобальных AI-очков в 2025 году

Компании из Дунгуаня отправили в 2025 году более 4 миллионов пар AI-очков, что почти наполовину составляет общемировой объём в 8,7 миллиона пар, сообщает исследовательская компания Omdia. Город в провинции Гуандун занял первое место в мире по объёмам поставок, а глобальные поставки AI-очков выросли на 322% по сравнению с прошлым годом. Позиция Дунгуаня на рынке и поддержка правительства Преобладание города в производстве AI-очков отражает как уже имеющуюся инфраструктуру электроники, так и недав

CryptoFrontier4ч назад

UXLINK интегрирует AI-инфраструктуру вычислений Origins Network для масштабирования Web3

11 мая в официальном объявлении UXLINK сообщила, что Web3-социальный протокол объявил о стратегическом сотрудничестве с Origins Network, чтобы интегрировать инфраструктуру децентрализованных вычислений на базе ИИ в свою экосистему. Партнёрство направлено на улучшение платформы UXLINK за счёт включения модульной блокчейн-инфраструктуры Origins Network, что позволит повысить вычислительные возможности для AI-driven децентрализованных приложений. Интеграция будет использовать механизм Proof-of-Comp

GateNews8ч назад

Tencent Cloud обеспечивает работу AI-банковского сервиса Ryt Bank для 50 000 пользователей в день запуска

По данным Tencent Cloud 11 мая компания объявила о партнёрстве с базирующимся в Малайзии цифровым банком Ryt Bank, чтобы поддержать его AI-ориентированную разговорную банковскую услугу с помощью Tencent Cloud Chat для обмена сообщениями в реальном времени. Система обслуживала 50 000 активных пользователей в день запуска без простоев, позволяя клиентам отдавать инструкции по платежам простым языком вместо навигации по меню приложения. Ryt Bank достиг 1,2 миллиона пользователей за более чем семь м

GateNews10ч назад

Reactor запускает демонстрацию real-time world model, собрав 7,8 миллиона просмотров

В сегодняшнем выпуске Beating Reactor запустила демонстрацию реальной модели мира в режиме реального времени, позволяющую пользователям генерировать интерактивные 3D-сцены с помощью облачной обработки на базе ИИ. Модель работает на глобальной облачной инфраструктуре компании с низкими задержками, устраняя необходимость в локальном оборудовании. В демонстрационном видео с красным спортивным автомобилем, который едет по ландшафту инопланетной пустыни, ИИ в реальном времени отрисовывал физику релье

GateNews10ч назад

Minara запускает сегодня первый AI-копилот для прогнозного рынка Hyperliquid HIP-4

Согласно BlockBeats, Minara AI запустила AI Prediction Copilot сегодня (11 мая), став первым инструментом для AI-прогнозных рынков, интегрированным с HIP-4 рынка Hyperliquid. Система анализирует краткосрочные тренды BTC, уровни поддержки и сопротивления, а также ценовые расхождения на рынке, чтобы выдавать торговые рекомендации YES/NO. Copilot выводит AI-вероятность, рыночную подразумеваемую вероятность, значение преимущества (edge) и ожидаемую доходность в реальном времени.

GateNews11ч назад
комментарий
0/400
Нет комментариев