ИИ распознает бурых медведей Аляски по лицу и создает фотобазу для ученых

Ученые создали первую «фотобазу лиц» аляскинских бурых медведей с помощью искусственного интеллекта. Команда биологов и дата-сайентистов разработала нейросетевой алгоритм, который распознает отдельных диких медведей по фотографиям с точностью свыше 84%. Новый инструмент под названием PoseSwin ориентируется не на шерсть или телосложение, а на устойчивые биометрические особенности головы, что позволяет отслеживать одних и тех же животных годами без чипирования, бирок и анализов ДНК.

Почему медведей так сложно «узнать в лицо»

Мониторинг популяций бурых медведей (Ursus arctos) всегда был серьезным вызовом для зоологов. У многих крупных животных — леопардов, жирафов, зебр — на шкуре есть уникальный рисунок пятен или полос, который можно использовать как естественный «штрих‑код». У медведей таких постоянных меток почти нет: их шерсть относительно однотонная и со временем меняет цвет и густоту.

Ситуацию усложняют и сезонные колебания:
- осенью медведь может быть вдвое тяжелее, чем весной;
- зимой отрастают густой подшерсток и длинная ость, кардинально меняя силуэт;
- после спячки животные выглядят худыми и «угловатыми», а к осени становятся массивными и лохматыми.

Все это делает визуальную идентификацию по общему виду тела крайне ненадежной. Классические методы основаны на поимке зверя, введении наркоза, установке чипа или ушной бирки и иногда — взятии генетического материала. Такие процедуры дороги, трудозатратны, увеличивают риск травм как для животных, так и для исследователей и вызывают сильный стресс у зверей. Для национальных парков и заповедников, где десятки и сотни особей регулярно появляются в популярных туристических точках, это неудобно и этически спорно.

Как собирали «фотоархив медведей»

Авторы работы, опубликованной в журнале Current Biology, сделали ставку на неинвазивный подход. В заповеднике Макнил‑Ривер на Аляске они создали огромный фотокаталог местных бурых медведей. В итоговый датасет вошло 72 940 изображений 109 хорошо изученных особей, полученных за шесть лет систематических полевых наблюдений.

Снимки делали в самых разных условиях:
- в разные сезоны;
- под различным освещением;
- на разных расстояниях и фокусных расстояниях объективов;
- при широком диапазоне поз и ракурсов — от фронтальных портретов до косых и боковых планов.

Такой разнородный набор фотографий позволил разработчикам подготовить систему к реалистичным полевым сценам, а не только к идеальным «паспортным» портретам зверей.

Что такое PoseSwin и чем он отличается от обычных нейросетей

На основе этого массива изображений ученые обучили модель PoseSwin — алгоритм, построенный на архитектуре визуальных трансформеров. В отличие от классических сверточных сетей, которые зачастую улавливают лишь общие текстуры и контуры, PoseSwin работает поэтапно и пытается «понять», как именно в пространстве расположена голова животного.

Алгоритм сначала:
1. определяет позу — где на снимке находятся нос, глаза, уши и прочие опорные точки;
2. строит геометрическое представление головы в трехмерном пространстве;
3. затем анализирует биометрические особенности морды: форму черепа, расстояние между глазами, посадку ушей, ширину переносицы, очертания носа и скул.

Благодаря такому подходу система может сравнивать между собой фотографии, сделанные с разных сторон и под разными углами. При этом временные изменения — вес, густота и длина шерсти, следы линьки — оказываются для модели второстепенными и в значительной степени игнорируются.

Насколько точен ИИ в реальных условиях

При проверке в полевых условиях PoseSwin показал впечатляющую точность. Если модель должна была узнать медведя в пределах одного сезона (то есть через несколько недель или месяцев после исходного снимка), точность идентификации составляла около 84%.

Задачу усложнили: системе предлагали найти того же зверя на фотографиях, сделанных в следующем году — уже после зимней спячки, набора или потери веса и смены шерсти. В этом режиме точность ожидаемо снизилась, но все равно осталась высокой — примерно на уровне 70%.

По сути, нейросеть научилась отбрасывать краткосрочные признаки наподобие кондиции тела или длины шерсти и опираться на стабильные, почти «скелетные» характеристики — форму черепа, относительное положение глаз и ушей, конфигурацию переносицы и линии лба.

Проверка в «открытом мире»

Один из ключевых тестов для подобных систем — так называемый режим «открытого мира». В реальности исследователи сталкиваются не только с известными особями, которые уже есть в базе, но и с новыми, ранее не зафиксированными животными.

PoseSwin прошел и эту проверку:
- алгоритм научился отличать «своих» медведей — тех, чьи лица уже есть в фотокаталоге;
- от «чужих» — новых зверей, отсутствующих в обучающей выборке.

Это означает, что модель может не только узнавать знакомых особей, но и сигнализировать ученым о появлении новых животных в районе наблюдений. Для парков и заповедников это важный инструмент: с его помощью легко отслеживать, как популяция пополняется мигрантами или молодыми медведями, вступающими во взрослую жизнь.

Как туристические снимки помогают науке

Практическую ценность разработанной системы ученые продемонстрировали на реальных любительских фотографиях. Исследователи загрузили в PoseSwin снимки, сделанные туристами в национальном парке Катмай, расположенном примерно в 65 километрах от заповедника Макнил‑Ривер, где обучалась нейросеть.

Несмотря на разницу в локациях, условиях съемки и качестве изображений, алгоритм сумел «узнать» некоторых уже известных ему животных. Так, система обнаружила в Катмай крупного самца по кличке Безухий — медведя, которого раньше фиксировали только на территории Макнил‑Ривер. Сравнение временных меток и маршрутов показало, что этот зверь регулярно перемещается между двумя охраняемыми территориями, преодолевая приличные расстояния.

Подобные совпадения позволяют прослеживать миграционные пути и радиусы перемещений конкретных медведей, а также уточнять, насколько сильно пересекаются популяции разных заповедников.

Чем такая технология важна для охраны природы

С появлением PoseSwin у биологов появился новый, мягкий по отношению к животным инструмент мониторинга. Его преимущества:
- полная неинвазивность: не требуется ловить, метить или усыплять животных;
- возможность работать с уже существующими фотоархивами и материалами туристов;
- снижение затрат и рисков при длительных программах наблюдений;
- более точная оценка численности и структуры популяций.

По снимкам можно восстановить судьбу конкретного медведя:
- сколько лет он появляется в одном и том же районе;
- меняет ли он предпочтительные места кормежки или отдыха;
- вступает ли в конфликты с другими крупными самцами;
- пересекается ли с людьми в туристических зонах и как часто.

На основе таких данных легче принимать решения о регулировании туризма, ограничении доступа в отдельные сезоны, а также о мерах по предотвращению опасных встреч людей и хищников.

Будущее: от медведей к другим видам

Хотя исследование было сосредоточено на бурых медведях, сама технология имеет куда более широкий потенциал. Принцип «сначала поза, потом биометрия» можно адаптировать:
- к другим видам крупных хищников — например, к белым медведям или волкам, у которых тоже нет яркого пятнистого рисунка;
- к морским млекопитающим, где важны очертания головы и плавников;
- к редким и малочисленным видам, для которых особенно важно не травмировать каждую особь при маркировке.

Если такие системы станут достаточно доступны, любой парк, заповедник или научная группа сможет строить собственные фотобазы «лиц» животных, развивая беспрецедентно детальные долгосрочные наблюдения.

Технические и этические ограничения

Несмотря на впечатляющие цифры, PoseSwin пока не идеален. Его точность все еще зависит от качества исходных фотографий: сильные помехи, закрытые морды, экстремальные ракурсы или объекты перед лицом животного могут сбивать алгоритм. В регионах с плохой освещенностью или при использовании устаревшей техники распознавание будет хуже.

Кроме того, модель обучена на конкретной популяции аляскинских медведей. При переносе в другие регионы — например, на Камчатку или в Скандинавию — систему придется дополнительно адаптировать и дозаполнять локальными снимками, чтобы учесть возможные различия во внешнем облике животных.

Встает и вопрос об ответственном использовании подобных технологий. Хотя в этом случае речь идет о диких животных, любые системы массовой идентификации требуют четких правил хранения и работы с данными, чтобы исключить риск их применения во вред — например, браконьерами, которые могли бы отслеживать ценных или особо крупных особей.

Как ИИ меняет полевую зоологию

Внедрение искусственного интеллекта в наблюдения за дикой природой фактически меняет саму логику полевой биологии. Там, где раньше требовались годы ручной разметки, просмотра десятков тысяч кадров и сложной логистики с отловом животных, теперь все большую часть работы берет на себя алгоритм.

Учёные могут концентрироваться на интерпретации данных — анализировать поведение, социальные связи внутри популяций, влияние климата и человеческого присутствия — вместо ручного перебора фотоматериалов. А туристы и фотографы, не меняя своих привычек, невольно пополняют научные базы, превращая любительские снимки в ценный инструмент исследований.

Перспектива: глобальные «фото‑паспорта» дикой природы

Если подобные системы будут развиваться и объединяться, через несколько лет может появиться нечто вроде глобального реестра «фото‑паспортов» для диких животных. Тогда:
- редкого медведя, зафиксированного на камеру туриста в одном парке, можно будет «узнать» в другом регионе спустя годы;
- миграции и связи между изолированными популяциями будут картироваться с высокой точностью;
- оценка влияния изменения климата и деятельности человека на хищников станет куда более детальной.

История с аляскинскими бурыми медведями показывает, что ИИ способен стать не только инструментом для бизнеса и медицины, но и мощным помощником в сохранении дикой природы. И чем больше качественных данных будет поступать в такие системы, тем точнее и человечнее станут программы защиты и изучения животных — без боли, стресса и лишнего вмешательства в их жизнь.

3
3
Прокрутить вверх