Face ID: как эта технология развивалась и чего от неё ждать в iPhone 17?
Чем ближе официальный анонс новой линейки iPhone, тем больше слухов и прогнозов о ней появляется. Часть из них связана с Face ID — технологией распознавания лиц, запатентованной Apple. Известно, что в компании продолжают работу над её изменением. Мы решили проследить, откуда она взялась, как развивалась и какой, возможно, будет в новом iPhone 17.
Содержание
- С чего всё началось?
- Первые разработки и ЦРУ
- Конец 80-х и 90-е — новый виток развития техники распознавания лиц
- 21-й век, сервисы распознавания лиц и соцсети
- Первые смартфоны со сканером сетчатки глаза
- Появление Face ID
- Как работает Face ID?
- Развитие технологии Face ID
- iPhone 17 станет эталонным?
- Резюме
С чего всё началось?
В 1955 году Оливер Селфридж, профессор Массачусетского технологического института, опубликовал статью «Глаза и уши для компьютера». Он выдвинул теорию о возможности оснащения компьютеров средствами распознавания звука и изображений. Отсюда начинается история развития биометрии и технологии Face ID.
Позднее в 1960-х годах актуальными задачами стали спутниковая фотосъёмка, распознавание символов и улучшение качества фотографий. Эти условия были благоприятными для первых экспериментов в области машинного распознавания лиц.
Первые разработки и ЦРУ
Родоначальником технологии является американский математик Вуди Бледсо. Изначально он работал с военными над испытаниями ядерного оружия. В какой-то момент интерес к программированию и математике подтолкнул его к другой сфере.
Бледсо совместно с авиационным инженером и биофизиком Ибеном Браунингом занялся автоматическим распознаванием образов. Сначала они сфокусировались на рукописных символах.
Вместе они создали простой, но эффективный метод n-мерных последовательностей. Суть заключалась в том, что символ, например, Q, проецировался на прямоугольную сетку, где каждая ячейка либо заполнена (1), либо пуста (0).
Затем эти ячейки превращались в список координат, которые компьютер сравнивал с эталонными. Если большинство координат совпадало, то символы считались идентичными.
Метод оказался рабочим, и коллеги основали свою компанию — Panoramic Research. Финансирование было скудным, хотя они получали поддержку от двух организаций, связанных с ЦРУ, и даже участвовали в работе над проектом MK-ULTRA. Это была программа ЦРУ по исследованию средств для вербовки агентов, стирания памяти, манипулирования сознанием при допросах. MK-ULTRA была более, чем сомнительной с этической точки зрения — допускались эксперименты над людьми, а целью было научиться полностью перепрограммировать личность.
В итоге Бледсо удалось получить поддержку от компании King-Hurley Research Group. Он планировал научить компьютер распознавать 10 лиц, но столкнулся с серьёзными препятствиями: отсутствием методов их оцифровки и крайне ограниченными ресурсами самих компьютеров. И главное — возникал вопрос, как перевести человеческую внешность в код?
Вуди решил разработать свой метод. Для этого он разделил обязанности в компании. Браунинг разрабатывал сканер для преобразования фотографий в десятки тысяч точек интенсивности света (от 0 до 3). Другой исследователь занимался подготовкой и оцифровкой снимков.
На себя и своих помощников Бледсо взял задачу по оценке поворота головы. Он и его ассистенты вручную отмечали точки на фото лица с разных ракурсов (анфас и 45 градусов), затем оцифровывали их и сопоставляли изображения с другими поворотами. Это была простая, но прорывная технология, напоминающая современные нейросети, но на более низком уровне детализации.
Первая попытка автоматического распознавания лиц оказалась неудачной — через год система не распознавала никого. Компьютер реагировал на малейшие изменения, включая старение, задача оказалась слишком сложной для технологий того времени.
Ещё через год стало ясно, что более эффективным будет метод разложения лица на составные части (глаза, уши, нос, брови, губы). Из-за технических ограничений, эти черты размечались вручную, а затем конвертировались в числовые значения для сравнения компьютером.
Для ускорения процесса разметки решили использовать передовой на тот момент планшет RAND. Он позволял рисовать машиночитаемые изображения, что значительно увеличило скорость оцифровки. Ещё оставались проблемы с мимикой и косметическими изменениями, но прогресс уже был очень ощутим.
1967 год стал годом триумфа разработок Вуди Бледсо: его команда получила реальный заказ от правительства США. Правоохранительным органам требовалась система автоматического сопоставления фото заключённых — задача, непосильная для ручной обработки.
На старте было предоставлено 400 фотографий мужчин европеоидной расы, с разным возрастом, поворотом головы и масштабом. Это создавало серьёзные вызовы для системы распознавания. Результат впечатлил: система Бледсо обрабатывала 100 лиц за 3 минуты, в то время как три человека тратили на эту же работу 6 часов.
Конец 80-х и 90-е — новый виток развития техники распознавания лиц
Нельзя сказать, что до 90-х в этой сфере ничего не происходило. Технологию постепенно совершенствовали, однако особо значимый скачок произошёл в 1988 году.
Тогда исследователи из Университета Брауна, Лоуренс Сирович и Майкл Кирби, создали Eigenface — собственную систему по распознаванию лиц, основанную на линейной алгебре. Они показали, что достаточно менее 100 числовых характеристик, чтобы точно описать изображение лица.
Особо интересно то, что в основе Eigenface оказалась работа головного мозга. Нейробиологи считают, что при распознавании лица наши нейроны реагируют не на общие черты, а на отклонения от «шаблонного» среднего значения.
Сирович и Кирби использовали этот принцип так. Они взяли 25 фото и сделали из них одно «среднее лицо», как если бы все фото были прозрачными и наложены друг на друга. Потом они создали 25 новых картинок, где показывались только отличия каждого лица от этого среднего.
Они поняли, что лица людей больше похожи, чем отличаются. Поэтому проще и лучше описывать каждое через отличия от среднего, а не рассматривать его целиком.
Этот подход открыл путь к более эффективному кодированию и ускорению обработки визуальных данных.
Затем в 1991 году исследователи в Массачусетском университете, Мэтью Тер и Алекс Пентланд, улучшили эту разработку, сделав опознавание лиц автоматическим.
21-й век, сервисы распознавания лиц и соцсети
В начале 2000-х технология вышла на государственный уровень: появилась программа FERET — совместная разработка ведомства при Минобороне США и Национального института стандартов и технологий.
Она поражала огромной базой данных — более 14 тысяч лиц. Изначально FERET была предназначена для отслеживания преступников по всему миру. Но впоследствии её открыли для общего доступа, чтобы стимулировать стимулировать коммерческие компании на создание собственных решений.
Этот подход дал свои плоды: уже в начале 2010-х социальная сеть Facebook (запрещенная в РФ) внедрила распознавание лиц для отметки друзей на фото. Вскоре аналогичную функцию добавил и ВКонтакте.
В 2015 году Google выпустила FaceNet — технологию распознавания лиц с рекордной точностью в 99,63%. Этот успех был бы невозможен без огромных объёмов данных, которые ежедневно собираются сервисами Google. FaceNet используется в Google Фото для сортировки изображений и распознавания людей.
Первые смартфоны со сканером сетчатки глаза
Ими стали ZTE Grand S3, вышедший в марте 2015 года, и Samsung Galaxy Note 7, вышедший в августе 2016 года. Эта технология должна была усовершенствовать систему безопасности по сравнению с вводом пароля и сканером отпечатка пальца.
Параллельно с этим, платёжные системы MasterCard, Visa и другие финансовые организации начали внедрять биометрическую аутентификацию для защиты платежей.
Появление Face ID
12 сентября 2017 года Apple совершила революцию, представив iPhone X с Face ID. Технология Face ID сканирует лицо и сравнивает его с сохранённой структурной картой лица владельца, обеспечивая высокую степень безопасности и удобства.
В дальнейшем единственной моделью, вышедшей без Face ID, стал iPhone SE второго поколения (2020 год).
Как работает Face ID?
Face ID функционирует благодаря уникальному сочетанию программного и аппаратного обеспечения Apple. Вот, как работает эта система:
- проектор генерирует более 30 000 невидимых инфракрасных точек, которые «рисуют» на лице пользователя точную математическую карту,
- инфракрасная камера считывает эту точечную структуру, формируя инфракрасное изображение и отправляя данные в процессор,
- инфракрасный излучатель гарантирует точное сканирование даже в полной темноте, направляя невидимый инфракрасный пучок света.
Развитие технологии Face ID
С 2018 года Apple начала внедрять Face ID в Pro-линейку своих iPad. Кроме того, с выходом iOS 13 скорость работы опции увеличилась на 30%, и компания продолжает над этим работать.
Сейчас Apple также сосредоточены над изменением конструкции. Первые iPhone с Face ID имели заметную выемку в верхней части дисплея. В iPhone 14 Pro компания применила более сложное инженерное решение, разделив вырез на две части и объединив их в одну «таблетку». Она стала частью интерфейса.
Цель Apple — «единый стеклянный корпус», где дисплей занимает всю переднюю панель. Для этого нужно скрыть под экраном Face ID и фронтальную камеру. Apple имеет патенты на Face ID и Touch ID под экраном, но пока не реализовала эту технологию.
iPhone 17 станет эталонным?
Встроенный Face ID и, следовательно, вид цельного куска стекла прогнозировали для iPhone 15 и 16. Эти ожидания не оправдались. Тем не менее, есть основания надеяться на новинку.
1. Появились утечки о том, что одна из моделей iPhone 17 может получить меньший вырез на дисплее.
При этом Аналитик Джефф Пу предположил, что iPhone 17 Pro Max будет иметь «значительно уменьшенный Dynamic Island». Самый логичный способ достичь этого — разместить Face ID под экраном.
2. Разработка iPhone 17 Air нацелена на максимальную лаконичность дизайна, что подталкивает к мысли об уменьшении Dynamic Island до размера отверстия камеры.
Изначально предполагалось, что iPhone 17 Air будет самой дорогой моделью, что могло бы свидетельствовать о внедрении новой технологии. Сейчас его цена под вопросом, но такая вероятность всё ещё не отпала.
Резюме
Сегодня Face ID — наиболее совершенная технология распознавания лица. Она отслеживает изменения внешности, используя нейронные сети процессора. Технология совершенствуется, Apple приобретает новые патенты на разработки. И даже само наличие утечек о ней говорит нам, что в недалёком будущем она выйдет на следующий уровень своего развития.