banner
Дом / Блог / Машинное обучение
Блог

Машинное обучение

Jul 05, 2023Jul 05, 2023

Научные данные, том 10, Номер статьи: 558 (2023) Цитировать эту статью

278 Доступов

1 Альтметрика

Подробности о метриках

В нашем исследовании мы намеревались собрать мультимодальный аннотированный набор данных для дистанционного зондирования археологии майя, который подходит для глубокого обучения. Набор данных охватывает территорию вокруг Чактуна, одного из крупнейших городских центров древних майя в центральной части полуострова Юкатан. Набор данных включает пять типов записей данных: растровые визуализации и модель высоты купола на основе данных воздушного лазерного сканирования (ALS), спутниковые данные Sentinel-1 и Sentinel-2, а также аннотации к данным, сделанные вручную. Ручные аннотации (используемые в виде бинарных масок) представляют три различных типа древних сооружений майя (метки классов: здания, платформы и агуады – искусственные водоемы) на территории исследования, их точное расположение и границы. Набор данных готов к использованию в машинном обучении, включая сверточные нейронные сети (CNN) для распознавания объектов, локализации (обнаружения) объектов и семантической сегментации. Мы хотели бы предоставить этот набор данных, чтобы помочь большему количеству исследовательских групп разработать свои собственные модели компьютерного зрения для изучения археологии майя или улучшить существующие.

Исследования с помощью воздушного лазерного сканирования (АЛС) оказались решающими для расширения знаний в области распределения археологических «объектов», особенно в лесных регионах древних майя1,2,3, поскольку они значительно ускорили и расширили традиционные археологические ландшафтные исследования. Исследовательское использование ALS в ландшафтной археологии обычно включает идентификацию, локализацию, регистрацию и исследование природных и культурных особенностей в различных, обычно взаимосвязанных контекстах, включая, помимо прочего, картографирование и анализ поселений, урбанизма, сельскохозяйственного производства и водное хозяйство4,5,6,7,8,9,10,11.

Археологи обычно проверяют данные ALS в форме растровой визуализации, которая улучшает восприятие особенностей поверхности12,13,14. Визуальный анализ человека и оцифровка отнимают много времени, а исследование сотен квадратных километров может занять месяцы, в зависимости от уровня детализации, количества структур и метода записи. Несмотря на отсутствие крупномасштабных общедоступных наборов данных ALS с высоким разрешением по древнему региону майя, рассредоточенное частное и государственное финансирование позволило проводить не только ландшафтные исследования для конкретных участков на нескольких квадратных километрах, например7,15,16 ,17,18, но и крупномасштабные исследования на площади в несколько сотен или даже нескольких тысяч квадратных километров, например3,5,11,19,20,21,22,23. Объем данных затрудняет аннотирование целых наборов данных, особенно если необходимо указать не только расположение объектов, но и их форму. Субъективность человеческого визуального осмотра и оцифровки, а также различия между людьми-интерпретаторами также являются проблемой24. Поэтому существует острая необходимость использовать методы компьютерного зрения, которые смогут находить археологические объекты и автоматически определять их границы25,26. Среди различных подходов к машинному обучению, глубокие сверточные нейронные сети (CNN) являются современными технологиями компьютерного зрения, но для их обучения обычно требуется большое количество уже размеченных образцов27. Это делает размеченные наборы данных решающими для разработки и тестирования методов.

В одном из наших предыдущих исследований мы уже продемонстрировали, что CNN могут классифицировать археологические объекты древних майя на основе визуализаций DEM, достигая точности до 95%28. Однако модели классификации не способны заменить ручную проверку и маркировку, для которых требуется семантическая сегментация. Семантическая сегментация легко применяется в дистанционном зондировании (обзор дан27), но тем более в медицинской визуализации, где CNN часто превосходят экспертов29,30,31,32,33,34.

Первоначальная цель сбора данных БАС в районе Чактуна, одного из крупнейших древних городских центров майя, известных до сих пор в центральной низменности полуострова Юкатан, заключалась в том, чтобы лучше понять управление водными ресурсами, сельское хозяйство, динамику поселений и социально-политические аспекты. организация древних майя, проживающих на этой территории11,35.

_.tif, where the data source can specify a mask, ALS visualisations (lidar), CHM, or Sentinel data (S1 or S2). The sequential number is a unique identifier of a data record; all files with the same sequential number represent the same geographical area, but differ in the number of pixels (480 × 480 pixels, 240 × 240 pixels or 24 × 24 pixels) and bit depth (8-bit integer or 32-bit float) (Table 7)./p>