Notice: file_put_contents(): Write of 16375 bytes failed with errno=28 No space left on device in /var/www/tgoop/post.php on line 50

Warning: file_put_contents(): Only 8192 of 24567 bytes written, possibly out of free disk space in /var/www/tgoop/post.php on line 50
Лаборатория Промптинга Замышляева@PromptLab_Mozlab P.101
PROMPTLAB_MOZLAB Telegram 101
Как сделать идеальную расшифровку аудио и саммари выступления. Открытый эксперимент

Привет, коллеги! Я уже писал, что вижу огромную ценность в том, чтобы показывать как можно более свежие кейсы применения нейросетей. Однако корпоративные выступления или примеры опубликовать по понятным причинам возможности нет, поэтому мы активно их создаем.

Сегодня мы решили показать, как можно получить качественную (надеюсь!) расшифровку аудио и что для этого потребуется. Это очень востребовано, например, на корпоративных конференциях. Особенно в сессиях вопросов и ответов (где нет презентации, по которой можно хоть как-то представить себе, о чем говорил спикер, если участник опоздал).

Расшифровка позволяет кратно экономить время на ознакомление с выступлением, а в бизнесе время сотрудников = деньги. Кроме того, ограниченный , скажем, пятиминутный, ресурс мотивации сотрудника может быть бесполезно израсходован на первые пять минут просмотра длинного видео… а при работе с текстом за это время удастся найти все самое важное!

Мы будем рассказывать о каждом шаге эксперимента;)

1. Выбрать спикера и договориться с ним о возможности расшифровки и о размещении оборудования;)

Мы выбрали хорошо вам известного Володю Казакова (он пишет про нейросети здесь, очень рекомендую его канал!), который часто сотрудничает с нашей Лабораторией промптинга. Он согласился на то, что его выступление будет расшифровано и предоставлено в открытый доступ*.

* — хах, это не самый простой вопрос, на самом деле;) вы когда-нибудь задумывались о том, что не все спикеры к этому готовы (да-да!) — потому что контент, неплохо звучащий устно, вполне может оказаться не столь прекрасным после расшифровки

На Володе мы разместили блютус-гарнитуру (в комментах фотка, мы выбирали из соображений адекватной цены и качества выше среднего, эта стоит 11тр и дает адекватное качество), чтобы минимизировать искажения. Это важно! Потому что звук, который запишет ваш телефон из зала, не даст расшифровщику качественно «прочувствовать» интонацию, чтобы расставить знаки препинания, а еще — повысит вероятность искажений.

Учитывая, что мотивация получить запись обратно пропорциональна времени, прошедшему с момента завершения выступления, и позволив себе вложить 10-20 минут на редакторскую правку текста, вы потеряете от 30 до 50% желающих получить расшифровку, то получается, что качественная расшифровка «с пылу с жару» нужна СРАЗУ. Поэтому не редактирование, а изначально высокое качество записи. Это еще и дешевле (единожды купить гарнитуру по сравнению с постоянной оплатой редактора).

2. Записать файл и отправить его на расшифровку нейросети

Берём mp3-файл на максималках и отправляем на расшифровку. До прошлой недели мы использовали Whisper AI. По результатам наших тестов он был лучшим. К тому же, его можно развернуть на локальной машине (правда, только на мощной) и тогда он решал вопрос конфиденциальности.

В этот раз мы попробуем и покажем вам новый сервис (ссылка и рецензия — в комментариях). Цена показалась довольно высокой, но качеством мы на данный момент довольны. Если вы знаете достойный или лучший аналог — пишите в комментарии! Вообще мне кажется, что в этой прикладной гонке сейчас будет постоянно меняться лидер…

3. Разместить в удобном месте и — наслаждаться!

Вот ссылка на расшифрованное выступление Володи. Это сделала нейросеть (Voicee, подробнее про неё здесь). Важно понимать, что Я НИЧЕГО НЕ ТРОГАЛ ВНУТРИ, только отрезал свою болтовню в начале и в конце.

Я успел посмотреть, мне очень понравилось качество. Единственная опечатка, которую я бегло заметил — это «Ежка» вместо «Джипитишки» (Володя имел в виду ChatGPT, сделав название уменьшительно-ласкательным и на русский манер). С другой стороны, а как вообще нейросеть сможет такое понять…

Хотя о! Я попробую сделать это промптом;)

4. Сделать саммари ключевых идей с помощью другой нейросети

(в следующем посте 👇 👇 👇)

в каталог промптов и кейсов применения нейросетей (20 кейсов!)

в Лабораторию промптинга МОЗЛаб: посмотреть и заказать обучение ваших сотрудников
Please open Telegram to view this post
VIEW IN TELEGRAM
12🔥12👍5



tgoop.com/PromptLab_Mozlab/101
Create:
Last Update:

Как сделать идеальную расшифровку аудио и саммари выступления. Открытый эксперимент

Привет, коллеги! Я уже писал, что вижу огромную ценность в том, чтобы показывать как можно более свежие кейсы применения нейросетей. Однако корпоративные выступления или примеры опубликовать по понятным причинам возможности нет, поэтому мы активно их создаем.

Сегодня мы решили показать, как можно получить качественную (надеюсь!) расшифровку аудио и что для этого потребуется. Это очень востребовано, например, на корпоративных конференциях. Особенно в сессиях вопросов и ответов (где нет презентации, по которой можно хоть как-то представить себе, о чем говорил спикер, если участник опоздал).

Расшифровка позволяет кратно экономить время на ознакомление с выступлением, а в бизнесе время сотрудников = деньги. Кроме того, ограниченный , скажем, пятиминутный, ресурс мотивации сотрудника может быть бесполезно израсходован на первые пять минут просмотра длинного видео… а при работе с текстом за это время удастся найти все самое важное!

Мы будем рассказывать о каждом шаге эксперимента;)

1. Выбрать спикера и договориться с ним о возможности расшифровки и о размещении оборудования;)

Мы выбрали хорошо вам известного Володю Казакова (он пишет про нейросети здесь, очень рекомендую его канал!), который часто сотрудничает с нашей Лабораторией промптинга. Он согласился на то, что его выступление будет расшифровано и предоставлено в открытый доступ*.

* — хах, это не самый простой вопрос, на самом деле;) вы когда-нибудь задумывались о том, что не все спикеры к этому готовы (да-да!) — потому что контент, неплохо звучащий устно, вполне может оказаться не столь прекрасным после расшифровки

На Володе мы разместили блютус-гарнитуру (в комментах фотка, мы выбирали из соображений адекватной цены и качества выше среднего, эта стоит 11тр и дает адекватное качество), чтобы минимизировать искажения. Это важно! Потому что звук, который запишет ваш телефон из зала, не даст расшифровщику качественно «прочувствовать» интонацию, чтобы расставить знаки препинания, а еще — повысит вероятность искажений.

Учитывая, что мотивация получить запись обратно пропорциональна времени, прошедшему с момента завершения выступления, и позволив себе вложить 10-20 минут на редакторскую правку текста, вы потеряете от 30 до 50% желающих получить расшифровку, то получается, что качественная расшифровка «с пылу с жару» нужна СРАЗУ. Поэтому не редактирование, а изначально высокое качество записи. Это еще и дешевле (единожды купить гарнитуру по сравнению с постоянной оплатой редактора).

2. Записать файл и отправить его на расшифровку нейросети

Берём mp3-файл на максималках и отправляем на расшифровку. До прошлой недели мы использовали Whisper AI. По результатам наших тестов он был лучшим. К тому же, его можно развернуть на локальной машине (правда, только на мощной) и тогда он решал вопрос конфиденциальности.

В этот раз мы попробуем и покажем вам новый сервис (ссылка и рецензия — в комментариях). Цена показалась довольно высокой, но качеством мы на данный момент довольны. Если вы знаете достойный или лучший аналог — пишите в комментарии! Вообще мне кажется, что в этой прикладной гонке сейчас будет постоянно меняться лидер…

3. Разместить в удобном месте и — наслаждаться!

Вот ссылка на расшифрованное выступление Володи. Это сделала нейросеть (Voicee, подробнее про неё здесь). Важно понимать, что Я НИЧЕГО НЕ ТРОГАЛ ВНУТРИ, только отрезал свою болтовню в начале и в конце.

Я успел посмотреть, мне очень понравилось качество. Единственная опечатка, которую я бегло заметил — это «Ежка» вместо «Джипитишки» (Володя имел в виду ChatGPT, сделав название уменьшительно-ласкательным и на русский манер). С другой стороны, а как вообще нейросеть сможет такое понять…

Хотя о! Я попробую сделать это промптом;)

4. Сделать саммари ключевых идей с помощью другой нейросети

(в следующем посте 👇 👇 👇)

в каталог промптов и кейсов применения нейросетей (20 кейсов!)

в Лабораторию промптинга МОЗЛаб: посмотреть и заказать обучение ваших сотрудников

BY Лаборатория Промптинга Замышляева


Share with your friend now:
tgoop.com/PromptLab_Mozlab/101

View MORE
Open in Telegram


Telegram News

Date: |

Telegram desktop app: In the upper left corner, click the Menu icon (the one with three lines). Select “New Channel” from the drop-down menu. How to create a business channel on Telegram? (Tutorial) As five out of seven counts were serious, Hui sentenced Ng to six years and six months in jail. To upload a logo, click the Menu icon and select “Manage Channel.” In a new window, hit the Camera icon. Just at this time, Bitcoin and the broader crypto market have dropped to new 2022 lows. The Bitcoin price has tanked 10 percent dropping to $20,000. On the other hand, the altcoin space is witnessing even more brutal correction. Bitcoin has dropped nearly 60 percent year-to-date and more than 70 percent since its all-time high in November 2021.
from us


Telegram Лаборатория Промптинга Замышляева
FROM American