Чтобы определить структуру молекулы по ЯМР-спектру, химики десятилетиями платили за лицензионный софт и учились им пользоваться. Anthropic протестировал Claude Opus 4.7 против ChemDraw и MestReNova на 20 соединениях — и получил сопоставимую точность на задаче, которую раньше ИИ не решал без специализированной дообучки.
Прямое предсказание (дать структуру → получить спектр) показало паритет со специализированными инструментами. На водороде Opus 4.7 дал среднюю ошибку ±0.079 ppm при допуске ±0.20 ppm — лучший результат среди всех инструментов в тесте. На углероде — фактическая ничья с MestReNova: ±1.37 против ±1.48 ppm. Отдельно замерили точность предсказания формы пика и расщепления: Claude попал в допуск примерно в 80% случаев, тогда как ChemDraw и MestReNova — в 26–35%.
Обратная задача — восстановить структуру молекулы из спектра — оказалась новой возможностью без спецсофта. Opus 4.7 получал молекулярную формулу и 1D-спектры, после чего предлагал до трёх кандидатов. Все 8 простых структур (одно кольцо или два фрагмента) модель восстановила верно с трёх попыток из трёх. Из 7 сложных — спироциклов и конденсированных колец, которые давали с подсказкой о реагенте, — 4 угаданы безошибочно, остальные с одной ошибкой из трёх. Классический CASE-софт для структурного анализа требует 2D-экспериментов (спектр с двумя осями вместо одной) и отдельных лицензий; Claude работает с тем, что химик и так вставил бы в чат.
Anthropic честно называет ограничения. Выборка мала: 20 соединений и 4 структурных класса для прямой задачи, 15 — для обратной. Сложные обратные задачи без подсказки о реагенте модель решала нестабильно — зацикливалась в рассуждениях, не выдавая итоговую структуру. Стереохимия, 2D-эксперименты и сложные природные соединения остались за рамками теста. Сами авторы называют результаты «индикативными, а не точными».
Главный сдвиг здесь — не точность на прямой задаче, где получился паритет, а то, что обратная задача стала доступна без лицензий и обучения. Но тест на 20 молекулах слишком мал для уверенных выводов: Anthropic сам признаёт, что нужны сотни соединений и 20–30 структурных классов. Пока это proof-of-concept, а не замена ChemDraw.