Определение состояния растений в режиме реального времени с помощью ИИ

Определение состояния растений в режиме реального времени с помощью ИИ

Агроном | Direct.Farm
2,49К

Распознать болезни растений путем оптического анализа признаков болезни на листьях - довольно сложная задача. Квалифицированным агрономам и фитопатологам часто требуется помощь для точной диагностики определенных заболеваний из-за разнообразия культур и фитопатологических проблем, что приводит к неправильным диагнозам и лечению. Фитопатологам, которым приходится ставить диагнозы путем визуального осмотра листьев больных растений, очень пригодилась бы разработка автоматизированных систем для выявления и диагностики болезней растений.

В настоящее время есть несколько стратегий минимизации заболеваний растений. Они включают удаление поврежденных листьев растений, механическую обработку и использование различных пестицидов. Прибегнуть к услугам агро-скаутов - простой способ обнаружения болезней на своих полях. Однако ручное обнаружение занимает много времени и является тяжелой работой. Типичной стратегией является использование пестицидов, но чрезмерное их использование еще до оценки требуемого количества может негативно повлиять как на растение, так и на окружающую среду и человека. 

Распознавание степени пораженности растений стало более доступным благодаря машинному обучению. Использование этого метода стало важным шагом к футуристическому будущему и позволяет упростить работу с обнаружением болезней растений. Кроме того, к этой технологии были добавлены методы обработки изображений, которые за последние 3 года достигли многого, и, в целом, уже сейчас показывают достойные результаты в идентификации болезней.

Каждое поврежденное растение имеет характерные визуальные признаки на листе, стебле и корнях; они могут быть использованы для дифференциации и маркировки инфекции как человеческим глазом, так и автоматически с помощью алгоритмов ИИ. В современных, постоянно меняющихся условиях раннее обнаружение и ранняя профилактика болезней крайне важны, чтобы избежать потерь, которые могут возникнуть в противном случае.

Вкратце, принцип работы определения болезни состоит из следующих этапов:

  1. ИИ определяет сам объект(лист) и его расположение;
  2. определяет и сравнивает признаки болезни растения на этом объекте;
  3. классифицирует болезнь.

На данный момент существует несколько проблем, влияющих на надежность и производительность этой техники, что затрудняет применение ИИ для выявления некоторых болезней.

Первой проблемой является вычислительное время машинного и глубокого обучения, поскольку некоторые методы, используемые для диагностики заболеваний растений, должны быть обновлены, т.к. они опираются на устаревшую информацию. Для создания и реализации основной массы задач машинного и глубокого обучения  требуется значительное количество ресурсов. Разработчики таких решений зачастую поддерживаются не государственными организациями, что может влиять на развитие и использование данной технологии.

На примере зарубежного исследования мы разберем в этой статье этапы разработки нейросети, определяющей пораженные участки растений - опишем концепцию и совершенствование модели, обучение и тестирование модели, объект исследования и процедуру работы. А затем рассмотрим полученные результаты, демонстрирующие жизнеспособность и прогресс модели.

Мы постараемся не вдаваться в технические тонкости, чтобы как можно больше людей смогло понять, о чем идет речь.

В данном исследовании была представлена тщательно подобранная литература о методах, используемых в настоящее время для идентификации больных растений. В ней также был приведен список литературы по наборам данных используемых в исследованиях и представлен сравнительный анализ, который выявил преимущества и недостатки различных алгоритмов. [Agriculture, Volume 13, Issue 2 (February 2023)]

     1. Сбор материалов.

Получение набора данных (исходных изображений, на которых учится нейросеть) - это одна из ключевых проблем, с которыми сталкиваются во время разработки ИИ, распознающего болезни по фото. Изображения предварительно обрабатывают и минимизируют нежелательные искажения.

Во взятом за основу исследовании была использована модель YOLOv5 на основе глубокого обучения. Однако, ее обучали не на определение болезни, а на определение поврежденных участков листа и его поражения, но принцип работы ИИ при этом не сильно меняется.

Используемая модель, согласно экспериментам, проведенным на изображениях со сложным фоном, выдает достаточно хороший результат. Таким образом, глубокое обучение является наиболее точным способом идентификации заболеваний у растений с наилучшими результатами.

Для обучения YOLOv5 нам требуется набор фотографий, содержащий не менее 2 000 изображений в качестве обучающих данных. Такие датасеты могут быть взяты как в открытом доступе, так и собраны самостоятельно.

     2. Подготовка данных к обучению.

Следующим шагом является маркирование данных после получения набора изображений. Вкратце, на изображении вокруг пораженной части листа человеком размечаются ограничительные рамки, как показано на рис 1. После правильной маркировки изображений мы получаем на выходе текстовый файл. Одно изображение может иметь несколько ограничительных рамок, в зависимости от состояния здоровья листьев.

На рис 2. показаны 2 типа данных, отражающих классы в наборе данных, на первом изображен нездоровый образец, а на втором - здоровый. 

Перенесем их в текстовый файл и дадим десятичное значение 0 и 1 (для ИИ определяющего пораженные участки на листе. Для определения болезни - их намного больше, в этом вся сложность.)

После сбора данных, разделяем их на тренировочные, тестовые и проверочные. В исследовании это 80/20 тренировки и тестирования, соответственно. Итого: 2311  фотографий.

     3. Выбор подходящей модели глубокого обучения.

Следующим этапом нужно выбрать и обучить модель обнаружению и классификации болезней растений. Во взятом за основу исследовании оценивалось 4 различных метода обнаружения целей, и мы остановились на модели YOLOv5, т.к. она обеспечивает точность обнаружения зоны поражения листа в 93,1% при 120 кадрах в секунду(FPS).  В пользу легкого дизайна и быстрого времени обнаружения, а также меньшего количества требуемых аппаратных средств для создания и работы учеными в этом исследовании была выбрана YOLOv5. Точность и эффективность крайне важны для выявления болезней.

     4. Обучение модели.

На основе собранного набора данных обучаем ИИ с нуля либо с использованием готовой стратегией обучения и получаем график обучения для оценки адекватности модели.

Чтобы начать обучение YOLOv5 требуется два файла. 1-й определяет местоположение текстовых и обучающих данных. 2-й - количество классов обнаруживаемых объектов и названия предметов, принадлежащих каждому классу. Как раз их мы подготовили во втором пункте. Кормим их нашей нейросети и смотрим что из этого получилось. 

При обучении нейронных сетей постоянно используется поток обучающих входных данных. Нейросеть проводит вычисления с этими данными. Она это делает снова и снова, опираясь на предыдущие значения и выискивая новые свойства для самообучения.

Условно, на нашем потоке данных нейросеть выяснила, что здоровый участок от пораженного отличается цветом, теперь она понимает, что если на фото зеленый участок, значит, это не болезнь. На следующем потоке входных данных нейросеть выяснила, что пятна отличаются по структуре, и если они зеленые, но сухие - это болезнь. Это означает, что процесс поиска состоит из эпох, каждая из которых немного улучшает параметры модели. В этих случаях сработают другие признаки, по которым нейросеть различит здоровый лист от пораженного.

     5. Анализ результатов.

Мы исследовали ошибки при валидации, минимальную точность, среднюю точность и отзывчивость. Графики на рис 3. показывают минимальную среднюю точность при 0,5 и минимальную среднюю точную в диапазоне от 0,5 до 0,95. Графики являются отличным инструментом для исследовательского анализа данных, поскольку они дают представление о взаимосвязях во всем наборе данных.

График средней точности постепенно увеличивается с увеличение эпох. Для построения графиков использовались критерии точности, отзывчивость и степень пересечения между ограничивающими рамками. На рис 4. изображен график точности, который увеличивается до 25 эпох, а затем колеблется.

На рис 5. показана итоговая метрика, которая увеличивается с каждой эпохой.

Рис 6.показывает, что потери при валидации YOLOv5 значительно уменьшились до эпохи 20. После этого потери при валидации уменьшились и остановились на уровне 0,06 и 0,05 в эпоху 30.

Матрица смешения показывает расположение между реальными и ожидаемыми значениями, как показано на рис 7. Она оценивает эффективность нашей модели классификации машинного обучения, используя структуру, подобную таблице. 

В общей сложности 190 изображений были истинно положительными в этой выборке. Восемь изображений в этой подборке были ложноположительными, а 28-ложноотрицательными. Кроме того, последние 513 изображений, идентифицированных как нездоровые, были определены правильно.

     6. Сравнение разных моделей.

На этих же данных были обучены и протестированы другие методы глубокого обучения. Напомним, что ученые преследовали цель обучить нейросеть определять пораженные участки листа, а не классифицировать болезнь, поэтому алгоритмы сравнивались именно по этому результату. В контексте определении болезней результаты будут другими.

На рис 8. показан сравнительный анализ между различными алгоритмами глубокого обучения. На графике показана минимальная точность определения, полученная от EfficentDet, FasterRCNN, YOLOv5(наш выбор) и YOLOv6.

Также преимуществом YOLOv5 было то, что по сравнению с FasterRCNN она работает в 2,5 раза быстрее и обеспечивает лучшую производительность при обнаружении даже небольших объектов.

     Выводы 

В данном исследовании использовались методы глубокого обучения для классификации здоровых и нездоровых листьев. Идентификация и распознавание болезней растений в экологическом мире имеют решающее значение для борьбы с болезнями растений. В данном исследовании была выполнена пошаговая процедура. Первым шагом был сбор данных; были включены два типа наборов данных, а затем мы провели их предварительную обработку. Маркировка была самым важным шагом в предварительной обработке, поскольку в данном исследовании необходимо было соблюсти формат, приемлемый для селективной нейронной сети, используемой для обнаружения  локализации объектов в интересующем регионе. Описанное исследование обеспечило приемлемый формат. Также эмпирически сравнивались четыре глубокие нейронные модели для определения лучших гиперпараметров и эксклюзивной проверки данных. Первоначально модель YOLOv5 была обучена на предварительно обученных гиперпараметрах, после чего мы скорректировали гиперпараметры, как показано в разделе результатов, так что минимальная средняя точность (0,5) была значительной, а конечный результат составил 93%. Подход в приведенном исследовании превзошел предыдущие итерации YOLO по скорости и точности. Он может повысить продуктивность сельскохозяйственных культур путем обнаружения и классификации болезней растений.

Опубликовано: 09 марта, 2023 в 11:00
Тэги:
Похожие посты
Изучение различных типов орошения и их применения
АГРОМОНИТОРИНГ
Устойчивость сортов к болезням
Бактерицид
Ржавчина подсолнечника – фунгициды

Нет комментариев