ХАНГЖОУ – Китайската фирма за изкуствен интелект DeepSeek стартира DeepSeekMath-V2, новаторски модел на математически разсъждения, който поставя нови стандарти за ефективност и изтласква границите на решаването на проблеми с помощта на изкуствен интелект.
Новият модел, който вече е с отворен код в Hugging Face и GitHub, въвежда нова самопроверяваща се рамка, предназначена да гарантира не само правилни отговори, но и логически надеждни и проверими доказателства.
Той демонстрира представяния, които достигнаха нива на златен медал както на Международната математическа олимпиада (IMO) през 2025 г., така и на Китайската математическа олимпиада (CMO) през 2024 г.
Трябва да се отбележи, че този модел също успя да спечели 118 от 120 точки в силно конкурентния изпит Putnam през 2024 г. – лесно надминавайки най-добрия човешки резултат от 90.
Мощността на модела беше допълнително консолидирана чрез IMO-ProofBench, където надмина модели като DeepThink на DeepMind.
Тази система противопоставя два големи езикови модела един срещу друг – единият действа като „доказващ“ за генериране на математически доказателства, докато другият служи като „рецензент“, за да проучи разсъжденията.
Такъв механизъм адресира критично ограничение в настоящите нива на постижения на AI – правилен окончателен отговор, който не гарантира правилен процес на разсъждение, според екипа на DeepSeek.
DeepSeek каза, че тези пробиви установяват самопроверяващите се математически разсъждения като жизнеспособен и обещаващ път към разработването на по-мощни и надеждни математически AI системи.
Нашия източник е Българо-Китайска Търговско-промишлена палaта