partially unsupervised@partially

partially unsupervised

Я уже недавно писал, что в эпоху LLM регулярки снова стали актуальным инструментом так называемого AI. Regex-in-the-loop как промежуточный вариант между "слепо доверимся черному ящику" и относительно дорогим human-in-the-loop.

И вот для тех, кто уже перешел с ChatGPT на что-то опенсорсное из зоопарка парнокопытных, уже появился враппер, который заставляет LLM-ку отвечать в заданном формате. Идея очень простая:

ReLLM filters non-matching tokens pre-generation. For each token, ReLLM tests every possible completion against a partial regex. For the potential completions that do not match the pattern, ReLLM masks the logits so that the language model does not generate them.

У меня нет бенчмарков, потому голословно выскажу предположение, что для ряда нехитрых продакшен задач такой нехитрый костыль сильно сократит отставание опенсорсных LLM от великого и могучего OpenAI.

👍40🔥6❤3🕊2

www.tgoop.com/partially_unsupervised/194

10.4K viewsMay 7, 2023 at 10:03

tgoop.com/partially_unsupervised/194

Create: 2023-05-07
Last Update: 2025-10-21 11:46:46

BY partially unsupervised

Share with your friend now:
tgoop.com/partially_unsupervised/194

Telegram News

Я уже недавно писал