Abstract | Strojno učenje postalo je važno sredstvo u gotovo svim područjima ljudskog rada. To je također slučaj i za znanost o tlu, gdje je razvijena brža i isplativija metoda za određivanje parametara tla, ako ju uspoređujemo s tradicionalnim laboratorijskim pristupom, tako da se kombiniralo strojno učenje i spektroskopija tla. Svrha ovog rada je testirati modele za predviđanje različitih parametara tla izgrađenih koristeći različite metode strojnog učenja i različite podatke dobivene MIR I Vis-NIR spektroskopijom. Parametri koje smo predviđali uključuju glinu, pijesak, mulj, organski ugljik, ukupni ugljik, kalcijev karbonat, pH, nasipnu gustoću, električnu vodljivost, kapacitet izmjene kationa, zadržavanje vode, dušik, kalcij, kalij, željezo i magnezij. Njih smo predviđali koristeći 3 metode strojnog učenja, a to su parcijalna regresija djelomičnih kvadrata, Cubist i jednodimenzionalna konvolucijska neuronska mreža. Utvrdili smo da su modeli imali bolje rezultate kada su bili trenirani koristeći MIR spektralne podatke, u usporedbi s onima koji su koristili Vis-NIR spektralne podatke. Drugo otkriće nam je da modeli koji su koristili Cubist u prosjeku imaju najbolje rezultate. Osim toga, ako uzmemo u obzir samo modele s najboljim rezultatima za svaki od predviđenih parametara tla, uspjeli smo razviti modele koji predviđaju organski ugljik, ukupni ugljik, kalcijev karbonat, kapacitet izmjene kationa, glinu, pijesak i kalcij s R2 vrijednostima većim od 0.9. Parametri tla za koje nismo uspjeli razviti modele s dobrim rezultatima su električna vodljivost i kalij, jer rezultati njihovih najboljih modela imaju R2 vrijednosti između 0.5 i 0.7. Općenito, korištenje strojnog učenja sa spektroskopijom tla daje modele s dobrim performansama, ali postoji prostor za poboljšanje. |
Abstract (english) | Machine learning has become an important asset in almost every area of human work. This is also the case for soil science, where a less time consuming and more cost-effective method of determining soil attributes, compared to traditional laboratory analysis, has developed using the combined efforts of machine learning and soil spectroscopy. The purpose of this paper is to test different machine learning methods and different data obtained using MIR and Vis-NIR spectroscopy by building models to predict various soil attributes. The ones we have predicted in this paper include clay, sand, silt, organic carbon, total carbon, calcium carbonate, pH, bulk density, electrical conductivity, cation exchange capacity, water retention, nitrogen, calcium, potassium, iron, and magnesium. To do this, 3 machine learning methods were used, which are partial least squares regression, Cubist, and the one-dimensional convolutional neural network. We have found that the models performed better when MIR spectral data is used to train them, compared to Vis-NIR spectral data. Another finding is that the machine learning method which produces models that perform the best on average is Cubist. Additionally, if we take into consideration only the best performing models for each predicted soil attribute into consideration, we have managed to create models that predict organic carbon, total carbon, calcium carbonate, cation exchange capacity, clay, sand, and calcium with R2 scores greater than 0.9. The soil attributes for which we did not create models that perform very well are electrical conductivity and potassium, for both of which the best performing models have R2 scores between 0.5 and 0.7. Generally, using machine learning with soil spectroscopy produces well-performing models, but there is room for improvement. |