Китайская компания DeepSeek анонсировала новую модель искусственного интеллекта Janus-Pro-7B, которая, по её утверждениям, превосходит DALL-E 3 от OpenAI и Stable Diffusion 3 Medium в задачах генерации изображений по текстовому запросу. Модель продемонстрировала высокий результат в нескольких тестах, включая лидерборд GenEval, где она набрала 0.80 балла, опередив конкурентов. Janus-Pro-7B значительно улучшает работу с мультимодальными данными, благодаря чему создаёт более качественные изображения.

Модель также отличается увеличенной ёмкостью — до 7 миллиардов параметров, что позволило улучшить её стабильность и масштабируемость. В отличие от предыдущих моделей компании, Janus-Pro-7B решает проблемы визуального кодирования, что делает её более эффективной и надёжной в генерации изображений. Помимо этого, DeepSeek заявляет, что разработка модели обошлась в 5,6 млн долларов, что значительно ниже затрат аналогичных проектов от лидеров отрасли.