LoRA не помогла: как мы дообучали Mistral 7B на русском и что в итоге сработалоКаждый раз после созвона происходит одно и то же самое: кто-то открывает чат и пишет «итак, что мы решили?». Дальше — пятнадцать минут на то, чтобы восстановить то, что только что обсуждали час. Я ML-инженер, и эта боль мне была знакома лично. Когда появилась идея автоматизировать протоколирование встреч, казалось, что задача решаемая: берешь Whisper для распознавания речи, хорошую LLM для суммаризации — и готово. Реальность оказалась другой. Готовых русскоязычных решений нужного качества не было. Mistral 7B — одна из лучших открытых моделей на тот момент — на русском ошибался в склонениях, плохо следовал русскоязычным промптам и терял смысл в длинных диалогах. Стало понятно: придётся дообучать самим.https://habr.com/ru/articles/1017634/#llm #mistral #lora #дообучение #nlp #nlp_обработка_текста #finetuning #whisper #суммаризация #bertscore
Related
VergeTerrence O'Brien、待ってましたですRevamped Siri will reportedly offer auto-deleting chats https://www.theverge.com/tech/9322...
VergeTerrence O'Brien、待ってましたですRevamped Siri will reportedly offer auto-deleting chats https://www.theverge.com/tech/932207/siri-apple-intelligence-auto-deleting-chats#Apple #LLM #n...
AI Prompt Injection Attacks 2026: Real Examples That WorkPrompt injection is the #1 vulnerability in LLM applications. T...
AI Prompt Injection Attacks 2026: Real Examples That WorkPrompt injection is the #1 vulnerability in LLM applications. Technical breakdown of attack vectors, real-world exploits, a...
…could the dark patterns be bugs? I don't believe so when #ClaudeCode is so eager to tell me it's done, good enough for ...
…could the dark patterns be bugs? I don't believe so when #ClaudeCode is so eager to tell me it's done, good enough for this session -- anything to stop when I have plenty of token...