11 лучших производителей этикеток 2023 года
Jul 15, 20231 причина, почему Трей Манчини — лучший вариант в дальней зоне «красных», чем Хосе Барреро
May 02, 202421 рецепт тыквенных специй, которые вы захотите приготовить навсегда
Aug 21, 202330 десертов, которые становятся лучше, если добавить кофе
Aug 22, 20235 соображений при выборе расточного инструмента
Aug 11, 2023Машинное обучение
Научные данные, том 10, Номер статьи: 558 (2023) Цитировать эту статью
278 Доступов
1 Альтметрика
Подробности о метриках
В нашем исследовании мы намеревались собрать мультимодальный аннотированный набор данных для дистанционного зондирования археологии майя, который подходит для глубокого обучения. Набор данных охватывает территорию вокруг Чактуна, одного из крупнейших городских центров древних майя в центральной части полуострова Юкатан. Набор данных включает пять типов записей данных: растровые визуализации и модель высоты купола на основе данных воздушного лазерного сканирования (ALS), спутниковые данные Sentinel-1 и Sentinel-2, а также аннотации к данным, сделанные вручную. Ручные аннотации (используемые в виде бинарных масок) представляют три различных типа древних сооружений майя (метки классов: здания, платформы и агуады – искусственные водоемы) на территории исследования, их точное расположение и границы. Набор данных готов к использованию в машинном обучении, включая сверточные нейронные сети (CNN) для распознавания объектов, локализации (обнаружения) объектов и семантической сегментации. Мы хотели бы предоставить этот набор данных, чтобы помочь большему количеству исследовательских групп разработать свои собственные модели компьютерного зрения для изучения археологии майя или улучшить существующие.
Исследования с помощью воздушного лазерного сканирования (АЛС) оказались решающими для расширения знаний в области распределения археологических «объектов», особенно в лесных регионах древних майя1,2,3, поскольку они значительно ускорили и расширили традиционные археологические ландшафтные исследования. Исследовательское использование ALS в ландшафтной археологии обычно включает идентификацию, локализацию, регистрацию и исследование природных и культурных особенностей в различных, обычно взаимосвязанных контекстах, включая, помимо прочего, картографирование и анализ поселений, урбанизма, сельскохозяйственного производства и водное хозяйство4,5,6,7,8,9,10,11.
Археологи обычно проверяют данные ALS в форме растровой визуализации, которая улучшает восприятие особенностей поверхности12,13,14. Визуальный анализ человека и оцифровка отнимают много времени, а исследование сотен квадратных километров может занять месяцы, в зависимости от уровня детализации, количества структур и метода записи. Несмотря на отсутствие крупномасштабных общедоступных наборов данных ALS с высоким разрешением по древнему региону майя, рассредоточенное частное и государственное финансирование позволило проводить не только ландшафтные исследования для конкретных участков на нескольких квадратных километрах, например7,15,16 ,17,18, но и крупномасштабные исследования на площади в несколько сотен или даже нескольких тысяч квадратных километров, например3,5,11,19,20,21,22,23. Объем данных затрудняет аннотирование целых наборов данных, особенно если необходимо указать не только расположение объектов, но и их форму. Субъективность человеческого визуального осмотра и оцифровки, а также различия между людьми-интерпретаторами также являются проблемой24. Поэтому существует острая необходимость использовать методы компьютерного зрения, которые смогут находить археологические объекты и автоматически определять их границы25,26. Среди различных подходов к машинному обучению, глубокие сверточные нейронные сети (CNN) являются современными технологиями компьютерного зрения, но для их обучения обычно требуется большое количество уже размеченных образцов27. Это делает размеченные наборы данных решающими для разработки и тестирования методов.
В одном из наших предыдущих исследований мы уже продемонстрировали, что CNN могут классифицировать археологические объекты древних майя на основе визуализаций DEM, достигая точности до 95%28. Однако модели классификации не способны заменить ручную проверку и маркировку, для которых требуется семантическая сегментация. Семантическая сегментация легко применяется в дистанционном зондировании (обзор дан27), но тем более в медицинской визуализации, где CNN часто превосходят экспертов29,30,31,32,33,34.
Первоначальная цель сбора данных БАС в районе Чактуна, одного из крупнейших древних городских центров майя, известных до сих пор в центральной низменности полуострова Юкатан, заключалась в том, чтобы лучше понять управление водными ресурсами, сельское хозяйство, динамику поселений и социально-политические аспекты. организация древних майя, проживающих на этой территории11,35.