AKWI-Tagungsband zur 35. AKWI-Jahrestagung, 2022, S. 353–362
AKWI 2022
Evaluierung des Dense Passage Retrievals zur Dokumentensuche in Behörden im Vergleich zu BM25

Bibtex

Cite as text

						@Inbook{Mehra+Prieß+Peters,
							Cite-key = "mehra2022", 
							Year= "2022", 
							 
							 Volume= "AKWI-Tagungsband zur 35. AKWI-Jahrestagung", 
							Pages= "S. 353–362", 
							Journal   = "Monographien",
							 Title= "Evaluierung des Dense Passage Retrievals zur Dokumentensuche in Behörden im Vergleich zu BM25", 
							Author= "Anket Mehra, Malte Prieß, Tom Vincent Peters", 
							Doi= "https://doi.org/10.30844/AKWI_2022_26", 
							 Abstract= "Die Suche nach Dokumenten ist eine der Aufgaben, die Maschinen am häufigsten ausführen.
Täglich genutzte Suchmaschinen suchen nach Dokumenten, um das Informationsbedürfnis
eines Anfragenden zu erfüllen. Aktuelle Forschungsergebnisse zeigen, dass der Bewertungsansatz
des Dense Passage Retrieval (DPR) – welcher die zu suchenden Dokumente mittels tiefer neuronaler
Netze in Dense-Vektoren umwandelt – in englischer ebenso wie in deutscher Sprache bessere
Ergebnisse liefert als aktuell implementierte Algorithmen wie der BM25-Algorithmus. Die Dokumentensuche
in deutschen Behörden stellt eine besondere Aufgabe dar, da in diesen komplexe behördenspezifische
Fachausdrücke verwendet werden. Im Rahmen dieser Arbeit wurde für die Dokumentensuche
zu Corona-Regelungen in der öffentlichen Verwaltung ein DPR mit einem öffentlichen
deutschsprachigen Datensatz trainiert und mit dem BM25-Algorithmus von Elasticsearch anhand
der Relevanz als Gütemaß verglichen. Die Ergebnisse zeigen, dass das DPR mehr Dokumente mit
gesuchten Informationen findet, Synonyme in Suchanfragen berücksichtigen kann und damit das
Potenzial zur Verbesserung der Dokumentensuche in Behördenanwendungen hat.", 
							 Keywords= "Dense Passage Retrieval, BM25, Natürliche Sprachverarbeitung, Künstliche Intelligenz, Neuronale Netze, Information Retrieval, Dokumentensuche", 
							}
					
Anket Mehra, Malte Prieß, Tom Vincent Peters(2022): Evaluierung des Dense Passage Retrievals zur Dokumentensuche in Behörden im Vergleich zu BM25. AKWI-Tagungsband zur 35. AKWI-Jahrestagung(2022), S. S. 353–362. Online: https://doi.org/10.30844/AKWI_2022_26 (Abgerufen 21.12.24)

Abstract

Abstract

Die Suche nach Dokumenten ist eine der Aufgaben, die Maschinen am häufigsten ausführen. Täglich genutzte Suchmaschinen suchen nach Dokumenten, um das Informationsbedürfnis eines Anfragenden zu erfüllen. Aktuelle Forschungsergebnisse zeigen, dass der Bewertungsansatz des Dense Passage Retrieval (DPR) – welcher die zu suchenden Dokumente mittels tiefer neuronaler Netze in Dense-Vektoren umwandelt – in englischer ebenso wie in deutscher Sprache bessere Ergebnisse liefert als aktuell implementierte Algorithmen wie der BM25-Algorithmus. Die Dokumentensuche in deutschen Behörden stellt eine besondere Aufgabe dar, da in diesen komplexe behördenspezifische Fachausdrücke verwendet werden. Im Rahmen dieser Arbeit wurde für die Dokumentensuche zu Corona-Regelungen in der öffentlichen Verwaltung ein DPR mit einem öffentlichen deutschsprachigen Datensatz trainiert und mit dem BM25-Algorithmus von Elasticsearch anhand der Relevanz als Gütemaß verglichen. Die Ergebnisse zeigen, dass das DPR mehr Dokumente mit gesuchten Informationen findet, Synonyme in Suchanfragen berücksichtigen kann und damit das Potenzial zur Verbesserung der Dokumentensuche in Behördenanwendungen hat.

Keywords

Schlüsselwörter

Dense Passage Retrieval, BM25, Natürliche Sprachverarbeitung, Künstliche Intelligenz, Neuronale Netze, Information Retrieval, Dokumentensuche

References

Referenzen

 

 

Most viewed articles

Meist angesehene Beiträge

AKWI 2022
GITO events | library.gito