Apple представила нейросеть, создающую реалистичные 3D-модели по одному фото
Компания Apple показала новую модель искусственного интеллекта, способную восстанавливать трёхмерные объекты всего по одному изображению.
Главная особенность — система учитывает освещение и отражения, благодаря чему результат выглядит максимально реалистично.
Как это работает
Метод получил название LiTo (Surface Light Field Tokenization).
Он использует латентное пространство, чтобы одновременно моделировать:
— геометрию объекта
— его внешний вид
Дополнительно учитываются:
— угол обзора
— условия освещения
Это позволяет добиться высокой детализации даже при минимуме исходных данных.
Два этапа генерации
Работа системы разделена на два шага:
- Энкодер — переводит положение объекта в цифровое представление
- Декодер — восстанавливает полноценную 3D-модель
👉 Включая сложные эффекты: блики, отражения и игру света
Как обучали модель
Для обучения использовали:
— тысячи объектов
— съёмку с 150 ракурсов
— три разных сценария освещения
После этого нейросеть научилась строить такие же модели, но уже по одному изображению.
Почему это важно
👉 Технология значительно упрощает 3D-реконструкцию
👉 Может использоваться в дизайне, играх и AR
📌 Подробности разработки Apple уже опубликовала в открытом доступе.
