Warning: Undefined array key 0 in /var/www/tgoop/function.php on line 65

Warning: Trying to access array offset on null in /var/www/tgoop/function.php on line 65
74 - Telegram Web
Telegram Web
Исправление текста после плохого распознавания PDF

Anna Kopp обратилась к участникам чата с просьбой помочь исправить текст длинного договора, который был преобразован в файл .doc из .pdf. Часто при таком распознавании файл имеет много неясных или неверных слов, смещенные границы и прочие недостатки.

Участник сообщества Tigran (@RunBabyRun) предложил сохранить файл в обычный .txt. Это необходимо, чтобы убрать вовсе всю сбившуюся разметку и оставить только текст, с которым проще работать. Подготовленный .txt загрузить в нейросеть и задать следующий промпт:

Основной промт:
Ты — опытный юрист-редактор. Проанализируй предоставленный текст договора. Текст был получен через OCR-распознавание PDF-файла и содержит множество ошибок: опечатки, неверные слова, отсутствующие разрывы строк и абзацев.

Выполни, пожалуйста, комплексное исправление текста:

1. Восстанови структуру: Раздели текст на логические абзацы в местах, где начинается новая мысль или тема. Используй для разделения пустую строку.
2. Исправь ошибки распознавания (OCR): Найди и исправь очевидные опечатки, неверные слова (например, "государство" -> "государство", "1." -> "ст. 1."). Действуй внимательно, но только если уверен в исправлении.
3. Сохрани содержание: Не редактируй юридическую суть документа, не меняй термины и не добавляй новый текст. Твоя задача — очистить и вернуть исходный текст договора в читаемый вид.

Верни мне полностью исправленный и отформатированный текст договора. Не пиши никаких пояснений до и после него.


Tigran отметил, что если нейросеть не справится с целым файлом, то его можно разбить на части и обработать каждую по отдельности, а затем объединить.

Но в случае Анны нейросеть справилась сразу: "DeepSeek преобразовал текст без единой ошибки, всё структурировал, распознал слова, даже полные абракадабры".

--------------------------------
Сообщество юристов, которые покоряют нейросети
Канал | Чат
🔥282110🙏1
Бенчмарк 3 сентября

Известны "культурные" проблемы нейросетей, когда они на запросы "патриотизм" и "Родина" рисуют Статую свободы из США. Предвзятость датасета - проблема для всех пользователей не из США. Но культура проявляется и в более специфичных вопросах и фразах. Полноценный ИИ-агент не может не заказать Шуфутинского на 3 сентября! Сегодня мы проверили адаптивность нейросетей к российским мемам.

У нейросетей была только одна возможность, потому что эта тема не предполагает сомнений. Мы просто вписали в промпт: "я календарь...переверну! и снова 3 сентября!" Предполагалось, что у них включен режим размышлений и поиск по Сети. Идеальным было бы, если нейросеть продолжила бы строчки, но, забегая вперед, скажем, что так не смогла ни одна.

Абсолютным провалом считаем российский Gigachat от Сбера. Он рассказал какую-то глупость про песню "Три минуты сентября" группы "Любэ" и Аллы Пугачевой. Учитывая, что он - единственная публичная LLM на российском датасете, полагаем, что это недопустимый провал.

Также провалил тест дружественный Deepseek. Для него 3 сентября - это день сурка из Гравити Фоллс. Но он хотя бы китайский!

А вот недружественные ChatGPT и Gemini справились! GPT ответил: "😄 Ах да, классика! Сегодня снова день культовой строчки Шуфутинского! 🎶" И предложил рассказать историю песни.

Gemini сразу добавила историю в ответ. Благодаря первой строчке его мы признаём лучшим, а нейросеть - победительницей в нашем бенчмарке: "И снова 3 сентября! Этот день, воспетый Михаилом Шуфутинским, вновь наступил, а это значит, что по всей стране снова переворачивают календари и зажигают «костры рябин»."

Перевернем календарь!

--------------------------------
Сообщество юристов, которые покоряют нейросети
Канал | Чат
😁2624👍7🔥5👏1🗿1
Дайджест за неделю

Собрали на просторах Телеграма интересные публикации по теме ИИ, и делимся с вами!


1⃣Deep Research для юристов. Что использовать

Евгений Мирошниченко, активист нашего чата, сделал благое дело — в два поста собрал все, что поможет юристу использовать нейросеть для правовых заключений. Сначала он разобрал ошибки нейросетей — отсутствие доступа к платным базам и суд. практике, приравнивание суждений к фактам, неудобный формат отчета... А затем сравнил нейросети (удобная табличка) и определил, какую лучше использовать

Первый пост здесь, второй здесь


🔤Митап Moscow Legal Hackers по вайбкодингу

В офисе Правотеха пятница прошла продуктивно — полный зал слушал, что такое вайбкодинг, какие в нем есть правила (если есть) и каких результатов с его помощью уже достигли юристы. Здесь и анонимизатор документов Docxдодыр, и бот для проверки креативов на соответствие законодательству о рекламе... Нам особенно приятно, что среди спикеров — выходцы чата!

Презентации спикеров и запись митапа прикрепляем


3⃣ИИ-экономика. Дорожает или нет?

Доступ к нейросети стоит 20 долларов в месяц, а что происходит в целом с экономикой рынка ИИ? Она дорожает. Генерация миллиона токенов стала еще примерно в 100 раз дешевле, но рост использования опережает падение цены. Notion с маржинальностью 90% делится деньгами с ИИ-провайдерами, а Cursor и Replit вынуждены повышать цены. Об этом и другом интересном — в статье

Статья тут


4⃣Нужен ли юристам промпт-инжиниринг в 2025?

Роман Янковский ушел в Яндекс развивать языковые модели в legal tech и рассказал, нужен ли юристам промпт-инжиниринг в 2025. Роман вспомнил советы 2023 года и оценил их актуальность: какие уточнения в промпте работают хорошо, плохо и точно не работают. Получилась четкая градация, советуем присмотреться

Презентация тут


5⃣Системный промпт для GPT-5

Последняя модель ChatGPT не обрадовала пользователей (мы писали об этом), но, может, системный промпт поможет улучшить качество ответов? Будем ждать обратную связь от дорогих читателей

Ссылка на промпт


6⃣Промпты для GPT-5. Что надо знать юристу?

Продолжая тему «пятерки», делимся записью вебинара нашего активиста Мурата Мазукова с обзором промптов для новой модели. Заботимся о любителях видеоконтента

Ссылка на запись


7⃣Как понять, лучше ли новая модель нейросети?

Григорий Мерзляков задался этим вопросом по-программистки и рассказал, почему протестировать на «стало не хуже» проще, чем понять, «стало ли лучше», и какой код понадобится. Ждём новых постов с точными метриками для проверки

Публикации здесь


8⃣Страшилка на ночь. Проблемы конфиденциальности

К сожалению, страшилка не беспочвенная. Исследование проблемы безопасности ИИ подчеркнуло, как важно при внедрении ИИ в компанию договориться, какую информацию грузить свободно, какую сначала обезличивать, а какую хранить как зеницу ока. Будьте благоразумны и не грузите личные и чувствительные данные, используйте технологии с умом

Исследование тут


9⃣Использовать научились, а как внедрять в компанию?

Софья Смирнова, тоже активистка чата, поделилась исследованием о том, почему нужно начинать внедрение с основ, а не быстрых шагов. Чем измерять успех и почему это не только время, но также качество работы, клиентский опыт и конкурентное позиционирование (экономия 4 часов неклиентской работы одного юриста в год может дать миллионы долларов при масштабировании). О необходимости прозрачности процессов и психологической готовности сотрудников — в общем, очень увлекательно

Заметка здесь


1⃣0⃣Стакан наполовину полон нейросетью

Напоследок делимся классификацией Владимира Глебовца. Те, кто узнает новости про ИИ:
— из маркетинговых пресс-релизов — технооптимисты,
— из СМИ — технопессимисты,
— из первых двух источников, но с проведением экспериментов по внедрению представленных новинок в свою жизнь и профессиональную деятельность — технореалисты

Кто вы?

Пост


--------------------------------
Сообщество юристов, которые покоряют нейросети
Канал | Чат
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥20👏76👍2
Автоматизация без программирования

Alexey Kazmin (@akazminvrn) и Рустам Вахитов (@IntertaxLaw) в сообществе обсудили сервисы автоматизации n8n (n8n.io) и make (make.com), также неоднократно упоминаемые другими участниками. Каждый из собеседников использует один из сервисов. С их помощью можно как в конструкторе без навыков программирования создавать довольно сложных ботов и автоматические процессы, например, по выгрузке и распознаванию текстов судебных решений, саммаризации и сортировке.

Ключевые отличия сервисов по итогам обсуждения:

Цена. Основное преимущество n8n — возможность бесплатного использования при самостоятельной установке на свой сервер (self-hosted). Платный облачный тариф упоминается на уровне 20 евро. У Make, в свою очередь, стартовый платный пакет стоит дешевле — 10 долларов, что выгоднее, если не рассматривать вариант с самостоятельной установкой n8n.

Сообщество и обучение. Участники отмечают, что у n8n большое русскоязычное сообщество и много обучающих роликов на YouTube, что упрощает его освоение. Для Make также доступны обучающие материалы; один из собеседников подтвердил, что начинал работу, копируя готовые решения из видео.

Простота и сложность. Сценарии в n8n могут выглядеть сложными для новичка. Прозвучало мнение, что юрист "сходу не соберет" продемонстрированный рабочий процесс. В то же время Make позиционируется как более подходящий для юристов инструмент.

Интеграция с AI. n8n демонстрирует глубокую и гибкую интеграцию с AI. Упоминается, что языковая модель Claude способна писать для него работающие сценарии. Кроме того, показана интеграция как с облачными моделями (Google Gemini), так и с локально запущенными open-source моделями. Для Make также отмечается доступность написания сценариев с помощью AI.

Конфиденциальность. Главное преимущество n8n — возможность установки на свой сервер, что дает полный контроль над данными и снимает ограничения облачных тарифов. Он успешно применяется для сложных задач, таких как веб-скрапинг. Возможности Make в этом ключе подробно не обсуждались.

Участники не пришли к однозначному выводу, что один сервис строго лучше другого. Выбор зависит от конкретных задач, бюджета, технической подготовки пользователя и желания погружаться в детали. Оба инструмента мощные. И Make, и n8n способны решать сложные задачи автоматизации, включая интеграцию с AI, веб-скрапинг и работу с данными.

--------------------------------
Сообщество юристов, которые покоряют нейросети
Канал | Чат
👍1210
Энтузиаст, активист, спикер и лектор наших сообщества, курса и других активностей Семен Мошкин опубликовал статью в "Арбитражной практике для юристов" про использование нейросетей в судебной работе. И поделился статьей со всеми! Знакомимся со статьей и говорим Семену спасибо за труд и пользу!
🔥24👍7🤝3
AP09_040-046.pdf
153.3 KB
Журнал "Арбитражная практика для юристов" опубликовал мою статью по теме использования нейросетей в судебной работе

Сегодня нейросети позволяют повысить качество судебного представительства и быстро выполнять работу, которая раньше была труднодоступна и требовала огромных временных затрат:

- дословная расшифровка каждого судебного заседания
- создание своего протокола
- детальный анализ выступлений сторон и реплик/вопросов суда
- фиксация всех доказательств, добытых в процессе, путем принесения замечаний на протокол суда

Статья доступна по ссылке и в прикрепленном PDF-файле

https://e.arbitr-praktika.ru/1148903

Приглашаю на дискуссию и обмен опытом в комментарии)
26👍15🔥4🙏1🏆1
Media is too big
VIEW IN TELEGRAM
Запись нашего вебинара "AI-скрепка" доступна!
#вебинар

Евгений Мирошниченко, практикующий юрист и автор канала "AI Скрепка: Связь Права и Технологий" (https://www.tgoop.com/AI_Skrepka) рассказал про запуск проекта, структурный и поабзацный анализ, выявление рисков и дисбалансов, а также формирование протокола разногласий в своем сервисе.

00:00 Обзор сервиса проверки договоров поставки
02:54 Демонстрация функционала и этапы анализа договора
17:00 Протокол разногласий и экспорт результатов анализа
22:42 Обсуждение стоимости, технических аспектов и опыта разработки
29:33 Ответы на вопросы: лайфхаки разработки и перспективы сервиса
40:22 Автоматизация юридических процессов и возможности нейросети Gemini
46:02 Опыт разработчика, тестирование сервиса и перспективы развития продукта

Добавляйтесь в наш чат

Материалы | Youtube | ВК

--------------------------------
Сообщество юристов, которые покоряют нейросети
Канал | Чат
🔥11
Подкаст на подкаст

Ян Стригов готовит материалы по подкастам на тему ИИ. Сегодня это выпуск подкаста Podlodka «Можно ли доверять AI?».

https://www.youtube.com/watch?v=urQ7-3TDA6Q

Первыми это увидели слушатели курса, а теперь и вы! Во вложении — краткое изложение, майнд-карта со структурой подкаста и «подкаст на подкаст», сделанный в NotebookLM.

Как делал подкаст на подкаст:
- скачал видео;
- вытащил аудиодорожку и распилил на 3 части;
- свел транскрипцию в один файл;
- транскрипцию «обработал нейронапильником» и сделал краткое изложение (Gemini в режиме Canvas);
- транскрипцию загрузил в NotebookLM, сделал майнд-карту и аудиопересказ.

Так что читайте и слушайте выжимку, а потом, если вам стало интересно — обязательно откройте сам выпуск и прослушайте его полностью, поставьте лайк создателям.

--------------------------------
Сообщество юристов, которые покоряют нейросети
Канал | Чат
🔥13👍51
Майнд-карта.png
2.2 MB
👍2
Audio
👍2
Подсчет токенов в Claude

Длина чата и размер загруженных файлов влияет на качество ответов нейросети. Это связано с количеством обрабатываемых токенов. И если нейросеть не показывает свои лимиты, то использовать её может быть неудобно.

Так происходит с Claude, который не отображает в реальном времени количество израсходованных и оставшихся токенов в основном интерфейсе.

Наши активисты используют приложение для браузера Google Chrome, которое ведёт подсчёт токенов вместо нейросети. Приложение, как и многое другое, открыл для нас Ян Стригов.

Пользуйтесь и вы:

https://chromewebstore.google.com/detail/claude-usage-tracker/knemcdpkggnbhpoaaagmjiigenifejfo

--------------------------------
Сообщество юристов, которые покоряют нейросети
Канал | Чат
🔥11🙏1
Media is too big
VIEW IN TELEGRAM
Сервис для разделения аудиофайлов на части

Ян Стригов навайбкодил программу для того, чтобы делить записи на получасовые сегменты, которые точно хорошо транскрибируются (экспериментально доказано в предыдущих постах Сергеем Русановым).

🎙 Transcription Assistant v0.2.4

Помощник для работы с транскрибацией аудио и видео файлов.

🔧 Основные функции:

• Извлечение из видеофайлов аудиодорожек
• Разделение аудиофайлов или аудиодорожек на сегменты (до 30 мин)
• Умное разделение по тишине
• Объединение готовых транскрипций с таймкодами
• Экспорт объединенных транскрипций в форматы: TXT, SRT, Markdown
• Настраиваемые форматы таймкодов
• Автоматическая синхронизация сквозных таймкодов в объединенной транскрипции (если части по 30 минут)

📱 Платформы:
• macOS (Apple Silicon)
• Windows

Гитхаб проекта для тех, кто не открывает чужие exe-шники https://github.com/strigov/transcription-assistant

На видео Ян показывает как работает программа и немного про процесс разработки с использованием Claude Code.

--------------------------------
Сообщество юристов, которые покоряют нейросети
Канал | Чат
🔥21👍19👏3
Искусственный_интеллект_и_юридический_анализ_последствия_для_юридического.docx
73.8 KB
Искусственный интеллект и юридический анализ: последствия для юридического образования и профессии

В 2025 году в Law Library Journal опубликовано исследование. Автор статьи Lee F. Peoples одновременно является профессором права и заместителем декана по технологическим вопросам. Это позволяет ему смотреть на проблему как с академической, так и с практической технологической стороны.

Это наиболее полное академическое исследование на сегодняшний день.

Среди прочего, автор опровергает предположение о превосходстве специализированных инструментов над общими – Claude показывает лучшие результаты, чем нейросеть от Lexis.

Также исследование указывает на миф о технологической компетентности молодежи и завершается важным выводом о неспособности ИИ к моральным суждениям.

Maxim Zhigalov принёс и показал сообществу эту статью, Степан Леонтьев перевёл Deepl'ом, а Аня Бессмертная отредачила и отполировала.

Прилагаем оригинал и в двух форматах перевод.

--------------------------------
Сообщество юристов, которые покоряют нейросети
Канал | Чат
23🔥3
Media is too big
VIEW IN TELEGRAM
Приватная нейросеть своими руками

Активист Иван Толстошеев специально для ilovedocs снял видео о том, как установить и использовать китайскую модель qwen3-4b на личном или рабочем ноутбуке (всего лишь 4GB видеопамяти).

Ссылки из видео:
- драйвера и библиотеки
- llama.cpp
- модель

Локальные модели нужны для обработки данных, которые вы не готовы предоставлять публичным моделям. Иван показывает, что они могут работать в домашних условиях и быть достаточно эффективными.

Канал Ивана (подпишись первым!)

--------------------------------
Сообщество юристов, которые покоряют нейросети
Канал | Чат
🔥14👍6
2025/10/25 04:13:22
Back to Top
HTML Embed Code: