Notice: file_put_contents(): Write of 16375 bytes failed with errno=28 No space left on device in /var/www/tgoop/post.php on line 50

Warning: file_put_contents(): Only 8192 of 24567 bytes written, possibly out of free disk space in /var/www/tgoop/post.php on line 50
Лаборатория Промптинга Замышляева@PromptLab_Mozlab P.101
PROMPTLAB_MOZLAB Telegram 101
Как сделать идеальную расшифровку аудио и саммари выступления. Открытый эксперимент

Привет, коллеги! Я уже писал, что вижу огромную ценность в том, чтобы показывать как можно более свежие кейсы применения нейросетей. Однако корпоративные выступления или примеры опубликовать по понятным причинам возможности нет, поэтому мы активно их создаем.

Сегодня мы решили показать, как можно получить качественную (надеюсь!) расшифровку аудио и что для этого потребуется. Это очень востребовано, например, на корпоративных конференциях. Особенно в сессиях вопросов и ответов (где нет презентации, по которой можно хоть как-то представить себе, о чем говорил спикер, если участник опоздал).

Расшифровка позволяет кратно экономить время на ознакомление с выступлением, а в бизнесе время сотрудников = деньги. Кроме того, ограниченный , скажем, пятиминутный, ресурс мотивации сотрудника может быть бесполезно израсходован на первые пять минут просмотра длинного видео… а при работе с текстом за это время удастся найти все самое важное!

Мы будем рассказывать о каждом шаге эксперимента;)

1. Выбрать спикера и договориться с ним о возможности расшифровки и о размещении оборудования;)

Мы выбрали хорошо вам известного Володю Казакова (он пишет про нейросети здесь, очень рекомендую его канал!), который часто сотрудничает с нашей Лабораторией промптинга. Он согласился на то, что его выступление будет расшифровано и предоставлено в открытый доступ*.

* — хах, это не самый простой вопрос, на самом деле;) вы когда-нибудь задумывались о том, что не все спикеры к этому готовы (да-да!) — потому что контент, неплохо звучащий устно, вполне может оказаться не столь прекрасным после расшифровки

На Володе мы разместили блютус-гарнитуру (в комментах фотка, мы выбирали из соображений адекватной цены и качества выше среднего, эта стоит 11тр и дает адекватное качество), чтобы минимизировать искажения. Это важно! Потому что звук, который запишет ваш телефон из зала, не даст расшифровщику качественно «прочувствовать» интонацию, чтобы расставить знаки препинания, а еще — повысит вероятность искажений.

Учитывая, что мотивация получить запись обратно пропорциональна времени, прошедшему с момента завершения выступления, и позволив себе вложить 10-20 минут на редакторскую правку текста, вы потеряете от 30 до 50% желающих получить расшифровку, то получается, что качественная расшифровка «с пылу с жару» нужна СРАЗУ. Поэтому не редактирование, а изначально высокое качество записи. Это еще и дешевле (единожды купить гарнитуру по сравнению с постоянной оплатой редактора).

2. Записать файл и отправить его на расшифровку нейросети

Берём mp3-файл на максималках и отправляем на расшифровку. До прошлой недели мы использовали Whisper AI. По результатам наших тестов он был лучшим. К тому же, его можно развернуть на локальной машине (правда, только на мощной) и тогда он решал вопрос конфиденциальности.

В этот раз мы попробуем и покажем вам новый сервис (ссылка и рецензия — в комментариях). Цена показалась довольно высокой, но качеством мы на данный момент довольны. Если вы знаете достойный или лучший аналог — пишите в комментарии! Вообще мне кажется, что в этой прикладной гонке сейчас будет постоянно меняться лидер…

3. Разместить в удобном месте и — наслаждаться!

Вот ссылка на расшифрованное выступление Володи. Это сделала нейросеть (Voicee, подробнее про неё здесь). Важно понимать, что Я НИЧЕГО НЕ ТРОГАЛ ВНУТРИ, только отрезал свою болтовню в начале и в конце.

Я успел посмотреть, мне очень понравилось качество. Единственная опечатка, которую я бегло заметил — это «Ежка» вместо «Джипитишки» (Володя имел в виду ChatGPT, сделав название уменьшительно-ласкательным и на русский манер). С другой стороны, а как вообще нейросеть сможет такое понять…

Хотя о! Я попробую сделать это промптом;)

4. Сделать саммари ключевых идей с помощью другой нейросети

(в следующем посте 👇 👇 👇)

в каталог промптов и кейсов применения нейросетей (20 кейсов!)

в Лабораторию промптинга МОЗЛаб: посмотреть и заказать обучение ваших сотрудников
Please open Telegram to view this post
VIEW IN TELEGRAM
12🔥12👍5



tgoop.com/PromptLab_Mozlab/101
Create:
Last Update:

Как сделать идеальную расшифровку аудио и саммари выступления. Открытый эксперимент

Привет, коллеги! Я уже писал, что вижу огромную ценность в том, чтобы показывать как можно более свежие кейсы применения нейросетей. Однако корпоративные выступления или примеры опубликовать по понятным причинам возможности нет, поэтому мы активно их создаем.

Сегодня мы решили показать, как можно получить качественную (надеюсь!) расшифровку аудио и что для этого потребуется. Это очень востребовано, например, на корпоративных конференциях. Особенно в сессиях вопросов и ответов (где нет презентации, по которой можно хоть как-то представить себе, о чем говорил спикер, если участник опоздал).

Расшифровка позволяет кратно экономить время на ознакомление с выступлением, а в бизнесе время сотрудников = деньги. Кроме того, ограниченный , скажем, пятиминутный, ресурс мотивации сотрудника может быть бесполезно израсходован на первые пять минут просмотра длинного видео… а при работе с текстом за это время удастся найти все самое важное!

Мы будем рассказывать о каждом шаге эксперимента;)

1. Выбрать спикера и договориться с ним о возможности расшифровки и о размещении оборудования;)

Мы выбрали хорошо вам известного Володю Казакова (он пишет про нейросети здесь, очень рекомендую его канал!), который часто сотрудничает с нашей Лабораторией промптинга. Он согласился на то, что его выступление будет расшифровано и предоставлено в открытый доступ*.

* — хах, это не самый простой вопрос, на самом деле;) вы когда-нибудь задумывались о том, что не все спикеры к этому готовы (да-да!) — потому что контент, неплохо звучащий устно, вполне может оказаться не столь прекрасным после расшифровки

На Володе мы разместили блютус-гарнитуру (в комментах фотка, мы выбирали из соображений адекватной цены и качества выше среднего, эта стоит 11тр и дает адекватное качество), чтобы минимизировать искажения. Это важно! Потому что звук, который запишет ваш телефон из зала, не даст расшифровщику качественно «прочувствовать» интонацию, чтобы расставить знаки препинания, а еще — повысит вероятность искажений.

Учитывая, что мотивация получить запись обратно пропорциональна времени, прошедшему с момента завершения выступления, и позволив себе вложить 10-20 минут на редакторскую правку текста, вы потеряете от 30 до 50% желающих получить расшифровку, то получается, что качественная расшифровка «с пылу с жару» нужна СРАЗУ. Поэтому не редактирование, а изначально высокое качество записи. Это еще и дешевле (единожды купить гарнитуру по сравнению с постоянной оплатой редактора).

2. Записать файл и отправить его на расшифровку нейросети

Берём mp3-файл на максималках и отправляем на расшифровку. До прошлой недели мы использовали Whisper AI. По результатам наших тестов он был лучшим. К тому же, его можно развернуть на локальной машине (правда, только на мощной) и тогда он решал вопрос конфиденциальности.

В этот раз мы попробуем и покажем вам новый сервис (ссылка и рецензия — в комментариях). Цена показалась довольно высокой, но качеством мы на данный момент довольны. Если вы знаете достойный или лучший аналог — пишите в комментарии! Вообще мне кажется, что в этой прикладной гонке сейчас будет постоянно меняться лидер…

3. Разместить в удобном месте и — наслаждаться!

Вот ссылка на расшифрованное выступление Володи. Это сделала нейросеть (Voicee, подробнее про неё здесь). Важно понимать, что Я НИЧЕГО НЕ ТРОГАЛ ВНУТРИ, только отрезал свою болтовню в начале и в конце.

Я успел посмотреть, мне очень понравилось качество. Единственная опечатка, которую я бегло заметил — это «Ежка» вместо «Джипитишки» (Володя имел в виду ChatGPT, сделав название уменьшительно-ласкательным и на русский манер). С другой стороны, а как вообще нейросеть сможет такое понять…

Хотя о! Я попробую сделать это промптом;)

4. Сделать саммари ключевых идей с помощью другой нейросети

(в следующем посте 👇 👇 👇)

в каталог промптов и кейсов применения нейросетей (20 кейсов!)

в Лабораторию промптинга МОЗЛаб: посмотреть и заказать обучение ваших сотрудников

BY Лаборатория Промптинга Замышляева


Share with your friend now:
tgoop.com/PromptLab_Mozlab/101

View MORE
Open in Telegram


Telegram News

Date: |

Telegram offers a powerful toolset that allows businesses to create and manage channels, groups, and bots to broadcast messages, engage in conversations, and offer reliable customer support via bots. The group also hosted discussions on committing arson, Judge Hui said, including setting roadblocks on fire, hurling petrol bombs at police stations and teaching people to make such weapons. The conversation linked to arson went on for two to three months, Hui said. Earlier, crypto enthusiasts had created a self-described “meme app” dubbed “gm” app wherein users would greet each other with “gm” or “good morning” messages. However, in September 2021, the gm app was down after a hacker reportedly gained access to the user data. As of Thursday, the SUCK Channel had 34,146 subscribers, with only one message dated August 28, 2020. It was an announcement stating that police had removed all posts on the channel because its content “contravenes the laws of Hong Kong.” In 2018, Telegram’s audience reached 200 million people, with 500,000 new users joining the messenger every day. It was launched for iOS on 14 August 2013 and Android on 20 October 2013.
from us


Telegram Лаборатория Промптинга Замышляева
FROM American