Google hat ein neuronales Netzwerk entwickelt, das verlorene Fragmente lateinischer Inschriften wiederherstellt

Von Viktor Tsyrfa | gestern, 00:52
Ein historischer Blick auf lateinische Schrift: keine Abstände zwischen den Wörtern Ein Beispiel für lateinische Schrift. Aufgrund des Platzmangels gab es oft keine Abstände zwischen den Wörtern. Quelle: Getty Images

Google DeepMind hat ein offenes neuronales Netzwerk namens Aeneas entwickelt, das bei der Wiederherstellung antiker beschädigter lateinischer Inschriften helfen kann. Die alten Römer hinterließen viele schriftliche Monumente, aber nicht alle von ihnen sind in perfektem Zustand erhalten geblieben. Viele sind beschädigt, und die meisten sind uns nur in Form von Fragmenten überliefert. Aeneas hilft, die verlorenen Teile des Textes wiederherzustellen.

Bronze militärisches Diplom aus Sardinien wiederhergestellt
Ein wiederhergestelltes bronzenes militärisches Diplom aus Sardinien, das von Kaiser Trajan einem Seemann auf einem Kriegsschiff verliehen wurde. Illustration: predictingthepast.com/aeneas

Halten Sie Ihren Skeptizismus in Schach

Ja, neuronale Netzwerke können Fehler machen und Dinge erfinden, die nicht existieren. Aber Google ging die Aufgabe mit einem wissenschaftlichen Ansatz an - um den Text wiederherzustellen, benötigt das neuronale Netzwerk Kontext. Der Kenntnisstand über den Zeitraum, zu dem der Fund gehört, und den Ort seiner Entdeckung ermöglicht es dem neuronalen Netzwerk, den Wortschatz auf den gefundenen Monumenten dieser Zeit sowie relevante Ereignisse jener Zeit zu analysieren, um die verlorenen Wörter so genau wie möglich zu erraten. Garantiert dies, dass Aeneas die originale Inschrift fehlerfrei reproduziert? Natürlich nicht, das ist unmöglich. Aber es wird eine wirklich gute Arbeit leisten, basierend auf einem wissenschaftlichen Ansatz und den leistungsstarken Möglichkeiten moderner Technologie. Diese Aufgabe ist besonders schwierig für Monumente, bei denen sogar die Länge des verlorenen Fragmentes unbekannt ist. Ja, das gibt keine 100%ige Garantie für die Authentizität. Aber für Monumente, die irreparabel beschädigt sind, werden wir nicht in der Lage sein, ein besseres Ergebnis zu erzielen. Zumindest bis zur Erfindung einer Zeitmaschine.

Technische Details von Aeneas

  • Das Modell erkennt sowohl Text als auch Bilder
  • Trainiert auf ~176.000 lateinischen Zeichen, insgesamt 16 Millionen Zeichen
  • Nach einem mythischen Helden aus dem trojanischen Epos benannt
  • Gemeinsam entwickelt von DeepMind und Forschern der Universitäten Nottingham, Warwick, Oxford und Athen
  • Attribution: bestimmt, wo (je nach einer von 62 Provinzen) und wann (genau auf ~13 Jahre) die Inschrift erstellt wurde
  • Effizienz: bei bis zu 10% der beschädigten Zeichen liegt die richtige Option 73% der Zeit vor; selbst ohne die Länge zu kennen - 58%
  • Suche nach Analogien: findet Parallelen in Stil, Form und Kontext

Eine interaktive Version von Aeneas ist unter predictingthepast.com verfügbar, und der Code sowie die Datenbank sind Forschern zugänglich.

Warum es wichtig ist

Neuronale Netzwerke sind sehr gut darin, Muster in großen Informationsmengen zu finden, in denen es für Menschen sehr schwierig ist, Zusammenhänge zu erkennen. Daher wird dieser Ansatz helfen, ein wenig mehr historische Informationen zurückzugewinnen. Selbst wenn es Fehler bei bestimmten Wörtern gibt, kann Aeneas die Hauptbotschaft des Textes vorschlagen.

Quelle: www.engadget.com