INGENIUMNOTES Telegram 1264
Forwarded from Спутник ДЗЗ
Фрагменты интервью с Сидом Дикситом-2

В коммерческом ДЗЗ наблюдается тенденция к тому, чтобы успех применения методов ИИ для обычных изображений повторить для геопространственных данных. Фактически, многие модели, такие как Chat GPT-4.0, уже сделали это, и могут в значительной степени распознавать объекты на спутниковых снимках. Растет и тенденция к использованию обучающих данных. Теперь предстоит выяснить, насколько эти две тенденции уравновешивают друг друга.

Я играл с Chat GPT-4.0, используя спутниковые снимки, и дал ему случайный снимок военной базы. У меня не было никаких ожиданий относительно того, что произойдёт. Некоторые из комментариев ИИ были такими: “Это похоже на спутниковый снимок военной базы. Судя по архитектуре здания, оно похоже на русскую архитектуру. Так что это может быть в России или в странах, где Россия построила подобное. Судя по рельефу, это похоже на засушливую местность. На изображении я вижу следующие самолеты. Они похожи на бомбардировщик определенного класса”. Вы знаете, это очень впечатляет.

Модель была действительно проницательна в определении сцены. Я задал ей другое изображение военной базы, которое нашёл с помощью поиска изображений Google, и попросил проанализировать снимок. Результат был что-то вроде: “Эй, я вижу несколько учебно-тренировочных самолетов, я вижу какую-то военную базу. Я вижу там часть бомбардировщика”. Сейчас это встроенные возможности Chat GPT-4.0, которые даже не отлажены. Представьте, что может произойти, когда вы сможете интегрировать эти модели в программное обеспечение гораздо более систематическим образом.

Для стартапов, которые незначительно улучшают алгоритмы решения частных задач, наступают трудные времена. Их алгоритмы могут быть уничтожены в одночасье большими языковыми моделями и не только ими. Мы находимся в мире ImageNet и больших моделей изображений, которые теперь являются частью Chat GPT-4.0 по умолчанию. Так что “секретный ингредиент”, который эти стартапы используют для извлечения информации, может исчезнуть.

Я думаю, что с развитием искусственного интеллекта мы переходим в мир мультимодального анализа и, в конечном счете, мультимодального мозга для анализа спутниковых или наземных данных ДЗЗ. У нас есть все виды разрешений. Вы говорите о низком и высоком разрешении — я имею в виду периферийное зрение, которое имеет низкое разрешение, и звук с разным разрешением, как у людей. Современные технологии приводят к тому, что несколько модальностей (изображение, звук и другие) начинают сливаться, и у нас будет ощущение слияния.

Что касается обороны, представьте, что вы аналитик или офицер среднего звена японского военно-морского флота. Вы садитесь перед своим компьютером и говорите: "Эй, пожалуйста, предоставьте мне отчет о ситуации за последние 24 часа". И система отвечает: “Я проанализировала спутниковые снимки из множества источников и обнаружила движение кораблей из страны X, следующих из порта A в порт B. В караване пять кораблей нового типа, что необычно. Они похожи на военные корабли. Там военное построение. Есть судно снабжения. Я увеличила частоту постановки задач спутникам в этом районе с еженедельной до двухдневной. Пожалуйста, одобрите этот запрос. Я продолжу следить за ситуацией и буду оповещать вас, как только появятся новые данные”.
👍4🔥1🤬1



tgoop.com/IngeniumNotes/1264
Create:
Last Update:

Фрагменты интервью с Сидом Дикситом-2

В коммерческом ДЗЗ наблюдается тенденция к тому, чтобы успех применения методов ИИ для обычных изображений повторить для геопространственных данных. Фактически, многие модели, такие как Chat GPT-4.0, уже сделали это, и могут в значительной степени распознавать объекты на спутниковых снимках. Растет и тенденция к использованию обучающих данных. Теперь предстоит выяснить, насколько эти две тенденции уравновешивают друг друга.

Я играл с Chat GPT-4.0, используя спутниковые снимки, и дал ему случайный снимок военной базы. У меня не было никаких ожиданий относительно того, что произойдёт. Некоторые из комментариев ИИ были такими: “Это похоже на спутниковый снимок военной базы. Судя по архитектуре здания, оно похоже на русскую архитектуру. Так что это может быть в России или в странах, где Россия построила подобное. Судя по рельефу, это похоже на засушливую местность. На изображении я вижу следующие самолеты. Они похожи на бомбардировщик определенного класса”. Вы знаете, это очень впечатляет.

Модель была действительно проницательна в определении сцены. Я задал ей другое изображение военной базы, которое нашёл с помощью поиска изображений Google, и попросил проанализировать снимок. Результат был что-то вроде: “Эй, я вижу несколько учебно-тренировочных самолетов, я вижу какую-то военную базу. Я вижу там часть бомбардировщика”. Сейчас это встроенные возможности Chat GPT-4.0, которые даже не отлажены. Представьте, что может произойти, когда вы сможете интегрировать эти модели в программное обеспечение гораздо более систематическим образом.

Для стартапов, которые незначительно улучшают алгоритмы решения частных задач, наступают трудные времена. Их алгоритмы могут быть уничтожены в одночасье большими языковыми моделями и не только ими. Мы находимся в мире ImageNet и больших моделей изображений, которые теперь являются частью Chat GPT-4.0 по умолчанию. Так что “секретный ингредиент”, который эти стартапы используют для извлечения информации, может исчезнуть.

Я думаю, что с развитием искусственного интеллекта мы переходим в мир мультимодального анализа и, в конечном счете, мультимодального мозга для анализа спутниковых или наземных данных ДЗЗ. У нас есть все виды разрешений. Вы говорите о низком и высоком разрешении — я имею в виду периферийное зрение, которое имеет низкое разрешение, и звук с разным разрешением, как у людей. Современные технологии приводят к тому, что несколько модальностей (изображение, звук и другие) начинают сливаться, и у нас будет ощущение слияния.

Что касается обороны, представьте, что вы аналитик или офицер среднего звена японского военно-морского флота. Вы садитесь перед своим компьютером и говорите: "Эй, пожалуйста, предоставьте мне отчет о ситуации за последние 24 часа". И система отвечает: “Я проанализировала спутниковые снимки из множества источников и обнаружила движение кораблей из страны X, следующих из порта A в порт B. В караване пять кораблей нового типа, что необычно. Они похожи на военные корабли. Там военное построение. Есть судно снабжения. Я увеличила частоту постановки задач спутникам в этом районе с еженедельной до двухдневной. Пожалуйста, одобрите этот запрос. Я продолжу следить за ситуацией и буду оповещать вас, как только появятся новые данные”.

BY Заметки инженера - исследователя


Share with your friend now:
tgoop.com/IngeniumNotes/1264

View MORE
Open in Telegram


Telegram News

Date: |

A new window will come up. Enter your channel name and bio. (See the character limits above.) Click “Create.” Unlimited number of subscribers per channel Invite up to 200 users from your contacts to join your channel So far, more than a dozen different members have contributed to the group, posting voice notes of themselves screaming, yelling, groaning, and wailing in various pitches and rhythms. Earlier, crypto enthusiasts had created a self-described “meme app” dubbed “gm” app wherein users would greet each other with “gm” or “good morning” messages. However, in September 2021, the gm app was down after a hacker reportedly gained access to the user data.
from us


Telegram Заметки инженера - исследователя
FROM American