NEURALDEEP Telegram 1510
Vibe Coding: Реальность vs хайп. Как за 7 дней по вечерам собрать MVP AI-платформы транскрибации

Предыстория: Год назад мы с Артёмом уже делали ASR на Whisper Large v2
Есть даже бот @daisytranscribe_bot он работает на базе него, но работал медленно

Внутри компании звонки множатся, все хотят транскрипт, саммари и закрепить в базе знаний (еще же нужно что бы точно безопасно!)
Решение: Отбросить сомнения как говорит Паша, не смотреть на код, главное фичи для пользователя!

Железо: 2x RTX 4500 (40GB) + RTX 4090 (48GB) освободились недавно значит берем
Стек: WhisperX + Qwen2.5-32B-Instruct + FastAPI + Vanilla JS + Python

Vibe Coding это что на деле?

Все бурлят про "AI написал мне приложение за день".
Реальность чуть-чуть сложнее
Я не написал ни одной функции с нуля. AI писал код, я только правил порты, адреса, конфиги
Но направлял архитектуру, принимал решения, тестировал, давал правки вел TODO
За 7 днями стоят 6 лет опыта в DevOps/архитектуре/разработке/дизайне/продукте

Факт №1 AI не заменяет экспертизу он ускоряет её

Результат
- 16,611 строк кода (Python 25.7%, JS 42%, CSS 15.1%)
- 3 компонента: Backend + Frontend + Chrome Extension
- 56 транскриптов обработано, 20 пользователей
- x8 ускорение от старого ASR
- Час 30 аудио → 8 минут обработки с саммари


Фичи
- WhisperX транскрипция с диаризацией
- Qwen2.5-32B-Instruct саммаризация (120k контекст!)
- Real-time транскрипция через WebSocket
- Chrome расширение для записи звука
- 6 форматов экспорта: SRT, DOCX, PDF, JSON, TSV, VTT
- Google OAuth авторизация


Дальше я выдал доступ к репо Артёму и он накидал док по которому мы дальше будем двигаться по правкам (тоже вырабатываем новый подход к разработке).

Как точно подметил Коля из чатика авторов про AI:
"Вообще эта дока – лучшая иллюстрация отличий vibecoding vs coding-with-ai. Что большая часть вайбкодеров из твиттера/ютуба даже никогда не узнают про такие косяки у себя в коде."

И это действительно так разница между "вроде работает" и системным подходом огромная



Да, есть проблемы пока БД плохо описана и в sqllite, перееду на PostgreSQL. Были глюки с авторизацией, за 2 дня переехал на Google OAuth
Проект модульный, взял лучшие практики, теперь твердая основа для транскрипции в компании есть

Главные инсайты для меня

1. Можно сделать MVP за 7 дней одному
Доказал: один человек = DevOps/Архитектор/Разработчик/Дизайнер/Продукт Но нужны 6 лет фундамента
Начни с простого проекта на знакомом стеке
Четкое ТЗ, нарисуй архитектуру разбей все на микрозадачи(конвертим в cursor rules
)
Делай каждый день по 2-3 часа, не растягивай


2. AI-ассистент меняет роль
От кодера к архитектору и тестировщику
Попробуй Cursor/GitHub Copilot на реальном проекте
Архитектурные паттерны, системный дизайн
Формулируй задачи четко, проверяй каждый результат


3. Проверка критична
AI пишет красивый код, который может работать неправильно или вовсе создаст вам моков (такое было раза 3 точно)
Я тестил каждую функцию руками и по несколько раз от апи до интерфейса


4. Vibe coding ≠ магия
AI помогает думать быстрее, но опыт незаменим
Системное мышление, понимание бизнес-логики
Изучай паттерны, архитектуру, best practices


5. Vibe coding точно быстрее
Особенно на старте и с 0 когда ты можешь нарезанные задачи раздать
толпе вкладок в том же курсоре их можно сделать несколько
Курсор не плохо сразу трудится над параллельными задачами главное сам не теряй фокус!


Факт №2 Я Потратил 820 вызовов в Cursor это не "одна кнопка"

Почему успех?

Сервисом реально пользуются!
Саммари после встреч приходят сразу 1:30 звонка транскрибица с разделением по ролям за 8 минут!
Когда код сделанный вот в таком формате решает проблемы людей лучшая мотивация.

2x RTX 4500 + RTX 4090 + неделя энтузиазма = AI-платформа в продакшене!

Факт №3: Solo до MVP легко, но от MVP до production нужна команда: SAST, масштабирование, безопасность AI (не учёл всё сразу).

P.S. Дальше, если наберется данных, расскажу про обучение транскодера для qwen2.5-7b-instruct

Скрины интерфейса и архитектуры в комментариях

P.S.S Планирую залить в open-source
7🔥94👍27💯6🤔3



tgoop.com/neuraldeep/1510
Create:
Last Update:

Vibe Coding: Реальность vs хайп. Как за 7 дней по вечерам собрать MVP AI-платформы транскрибации

Предыстория: Год назад мы с Артёмом уже делали ASR на Whisper Large v2
Есть даже бот @daisytranscribe_bot он работает на базе него, но работал медленно

Внутри компании звонки множатся, все хотят транскрипт, саммари и закрепить в базе знаний (еще же нужно что бы точно безопасно!)
Решение: Отбросить сомнения как говорит Паша, не смотреть на код, главное фичи для пользователя!

Железо: 2x RTX 4500 (40GB) + RTX 4090 (48GB) освободились недавно значит берем
Стек: WhisperX + Qwen2.5-32B-Instruct + FastAPI + Vanilla JS + Python

Vibe Coding это что на деле?

Все бурлят про "AI написал мне приложение за день".
Реальность чуть-чуть сложнее
Я не написал ни одной функции с нуля. AI писал код, я только правил порты, адреса, конфиги
Но направлял архитектуру, принимал решения, тестировал, давал правки вел TODO
За 7 днями стоят 6 лет опыта в DevOps/архитектуре/разработке/дизайне/продукте

Факт №1 AI не заменяет экспертизу он ускоряет её

Результат

- 16,611 строк кода (Python 25.7%, JS 42%, CSS 15.1%)
- 3 компонента: Backend + Frontend + Chrome Extension
- 56 транскриптов обработано, 20 пользователей
- x8 ускорение от старого ASR
- Час 30 аудио → 8 минут обработки с саммари


Фичи
- WhisperX транскрипция с диаризацией
- Qwen2.5-32B-Instruct саммаризация (120k контекст!)
- Real-time транскрипция через WebSocket
- Chrome расширение для записи звука
- 6 форматов экспорта: SRT, DOCX, PDF, JSON, TSV, VTT
- Google OAuth авторизация


Дальше я выдал доступ к репо Артёму и он накидал док по которому мы дальше будем двигаться по правкам (тоже вырабатываем новый подход к разработке).

Как точно подметил Коля из чатика авторов про AI:
"Вообще эта дока – лучшая иллюстрация отличий vibecoding vs coding-with-ai. Что большая часть вайбкодеров из твиттера/ютуба даже никогда не узнают про такие косяки у себя в коде."

И это действительно так разница между "вроде работает" и системным подходом огромная



Да, есть проблемы пока БД плохо описана и в sqllite, перееду на PostgreSQL. Были глюки с авторизацией, за 2 дня переехал на Google OAuth
Проект модульный, взял лучшие практики, теперь твердая основа для транскрипции в компании есть

Главные инсайты для меня

1. Можно сделать MVP за 7 дней одному
Доказал: один человек = DevOps/Архитектор/Разработчик/Дизайнер/Продукт Но нужны 6 лет фундамента
Начни с простого проекта на знакомом стеке
Четкое ТЗ, нарисуй архитектуру разбей все на микрозадачи(конвертим в cursor rules
)
Делай каждый день по 2-3 часа, не растягивай


2. AI-ассистент меняет роль
От кодера к архитектору и тестировщику
Попробуй Cursor/GitHub Copilot на реальном проекте
Архитектурные паттерны, системный дизайн
Формулируй задачи четко, проверяй каждый результат


3. Проверка критична
AI пишет красивый код, который может работать неправильно или вовсе создаст вам моков (такое было раза 3 точно)
Я тестил каждую функцию руками и по несколько раз от апи до интерфейса


4. Vibe coding ≠ магия
AI помогает думать быстрее, но опыт незаменим
Системное мышление, понимание бизнес-логики
Изучай паттерны, архитектуру, best practices


5. Vibe coding точно быстрее
Особенно на старте и с 0 когда ты можешь нарезанные задачи раздать
толпе вкладок в том же курсоре их можно сделать несколько
Курсор не плохо сразу трудится над параллельными задачами главное сам не теряй фокус!


Факт №2 Я Потратил 820 вызовов в Cursor это не "одна кнопка"

Почему успех?

Сервисом реально пользуются!
Саммари после встреч приходят сразу 1:30 звонка транскрибица с разделением по ролям за 8 минут!
Когда код сделанный вот в таком формате решает проблемы людей лучшая мотивация.

2x RTX 4500 + RTX 4090 + неделя энтузиазма = AI-платформа в продакшене!

Факт №3: Solo до MVP легко, но от MVP до production нужна команда: SAST, масштабирование, безопасность AI (не учёл всё сразу).

P.S. Дальше, если наберется данных, расскажу про обучение транскодера для qwen2.5-7b-instruct

Скрины интерфейса и архитектуры в комментариях

P.S.S Планирую залить в open-source

BY Neural Kovalskii


Share with your friend now:
tgoop.com/neuraldeep/1510

View MORE
Open in Telegram


Telegram News

Date: |

The administrator of a telegram group, "Suck Channel," was sentenced to six years and six months in prison for seven counts of incitement yesterday. As of Thursday, the SUCK Channel had 34,146 subscribers, with only one message dated August 28, 2020. It was an announcement stating that police had removed all posts on the channel because its content “contravenes the laws of Hong Kong.” 5Telegram Channel avatar size/dimensions While some crypto traders move toward screaming as a coping mechanism, many mental health experts have argued that “scream therapy” is pseudoscience. Scientific research or no, it obviously feels good. Find your optimal posting schedule and stick to it. The peak posting times include 8 am, 6 pm, and 8 pm on social media. Try to publish serious stuff in the morning and leave less demanding content later in the day.
from us


Telegram Neural Kovalskii
FROM American