Фрагменты интервью с Сидом Дикситом-2

Фрагменты интервью с Сидом Дикситом-2

В коммерческом ДЗЗ наблюдается тенденция к тому, чтобы успех применения методов ИИ для обычных изображений повторить для геопространственных данных. Фактически, многие модели, такие как Chat GPT-4.0, уже сделали это, и могут в значительной степени распознавать объекты на спутниковых снимках. Растет и тенденция к использованию обучающих данных. Теперь предстоит выяснить, насколько эти две тенденции уравновешивают друг друга.

Я играл с Chat GPT-4.0, используя спутниковые снимки, и дал ему случайный снимок военной базы. У меня не было никаких ожиданий относительно того, что произойдёт. Некоторые из комментариев ИИ были такими: “Это похоже на спутниковый снимок военной базы. Судя по архитектуре здания, оно похоже на русскую архитектуру. Так что это может быть в России или в странах, где Россия построила подобное. Судя по рельефу, это похоже на засушливую местность. На изображении я вижу следующие самолеты. Они похожи на бомбардировщик определенного класса”. Вы знаете, это очень впечатляет.

Модель была действительно проницательна в определении сцены. Я задал ей другое изображение военной базы, которое нашёл с помощью поиска изображений Google, и попросил проанализировать снимок. Результат был что-то вроде: “Эй, я вижу несколько учебно-тренировочных самолетов, я вижу какую-то военную базу. Я вижу там часть бомбардировщика”. Сейчас это встроенные возможности Chat GPT-4.0, которые даже не отлажены. Представьте, что может произойти, когда вы сможете интегрировать эти модели в программное обеспечение гораздо более систематическим образом.

Для стартапов, которые незначительно улучшают алгоритмы решения частных задач, наступают трудные времена. Их алгоритмы могут быть уничтожены в одночасье большими языковыми моделями и не только ими. Мы находимся в мире ImageNet и больших моделей изображений, которые теперь являются частью Chat GPT-4.0 по умолчанию. Так что “секретный ингредиент”, который эти стартапы используют для извлечения информации, может исчезнуть.

Я думаю, что с развитием искусственного интеллекта мы переходим в мир мультимодального анализа и, в конечном счете, мультимодального мозга для анализа спутниковых или наземных данных ДЗЗ. У нас есть все виды разрешений. Вы говорите о низком и высоком разрешении — я имею в виду периферийное зрение, которое имеет низкое разрешение, и звук с разным разрешением, как у людей. Современные технологии приводят к тому, что несколько модальностей (изображение, звук и другие) начинают сливаться, и у нас будет ощущение слияния.

Что касается обороны, представьте, что вы аналитик или офицер среднего звена японского военно-морского флота. Вы садитесь перед своим компьютером и говорите: "Эй, пожалуйста, предоставьте мне отчет о ситуации за последние 24 часа". И система отвечает: “Я проанализировала спутниковые снимки из множества источников и обнаружила движение кораблей из страны X, следующих из порта A в порт B. В караване пять кораблей нового типа, что необычно. Они похожи на военные корабли. Там военное построение. Есть судно снабжения. Я увеличила частоту постановки задач спутникам в этом районе с еженедельной до двухдневной. Пожалуйста, одобрите этот запрос. Я продолжу следить за ситуацией и буду оповещать вас, как только появятся новые данные”.

👍4🔥1🤬1

www.tgoop.com/IngeniumNotes/1264

255 viewsJun 21, 2024 at 09:52

tgoop.com/IngeniumNotes/1264

Create: 2024-06-21
Last Update: 2025-07-14 07:52:05

BY Заметки инженера - исследователя

Share with your friend now:
tgoop.com/IngeniumNotes/1264

Telegram News

Фрагменты интервью с Сидом Дикситом-2