Frage stellen
dschinn

Geht das wirklich nicht besser im Jahre a.d. 2017?

Habe hier gerade beim Kampfsurfen eine Seite in Hindi gefunden und diese dem Gockel vorgeworfen...

Da kommt dann so ein Quatsch raus:
<ZITAT>
Menschen aus ländlichen Gebieten beginnen, den göttlichen Zorn zu verstehen.
Jetzt sind die Menschen zur Anbetung Dorf eifrig.
Dorf Panda Göttinnen auf Stein Götter beteten regen gestoppt.
Er sagt, dass er zum ersten Mal in meinem Leben ein solches Ereignis gesehen.
Es wird erwartet, dass es göttlicher Zorn von Anbetung weg sein wird.
Dorfmädchen von den Event-Männer leben in Panik.
Frightened Dorfbewohner hörten auf zu essen und zu trinken.
Komplette Furcht vor jedem untoward Dorf erschien wieder auf den Straßen außerhalb ihrer Häuser.
Der Bezirk ist auch Vizepräsident der panchayat können von diesem Ereignis.
Er sagt, dass, wenn sie offenbart nicht glauben, in abergläubischen, so sobald das Ereignis sie hier im Dorf angekommen.
>ZITAT ENDE>

Nee oder?
Das ist alles was wir können?
Isch geh kaputt, wer geht mit?
Frage beantworten Frage Nummer 3000077777 Frage melden

Antworten (14)
Cheru
Und wenn man das gesprochen hört, klingt es wie ein Zweitakter aus dem DDR-Automobilbau...
Melden
Matthew
Lach!
Hat der Technikchef von Google nicht angekündigt, in 20 Jahren würden Computer den Menschen an Intelligenz überholen?
Die Feinsinnigkeit dieser Übersetzung hat mich jetzt doch überzeugt! Wir sind auf einem guten Weg.
Melden
Deho
Nein, Anno 2017 geht das nicht besser, 2025 wird es vermutlich besser gehen. Das zeigt die Evolution der bisherigen Übersetzungsprogramme. Anfangs unbrauchbar, danach schlecht, und auch heute noch nicht gut, aber eine Extrapolation in die Zukunft lässt hoffen.

Der Computer hat keine Intelligenz, er kann nur das leisten, was der Programmierer vorher an Algortithmen, auch Lernalgorithmen (siehe Schachcomputer) eingegeben hat. Und Schach folgt logischeren Regeln als Sprache.

Das angeführte Beispiel lässt vermuten, dass hier Hindu erst ins Englische und danach ins Deutsche übersetzt wurde (frightened Dorfbewohner). Das verfielfacht natürlich Fehler. Die Vermutung resultiert daraus, dass aus historischen Gründen Hindu bisher eher ins Englische als ins Deutsche übersetzt wurde.
Melden
Deho
Natürlich "vervielfacht", das sollte keine Fielmann-Werbung sein.
Melden
wokk
Das ist auch so bei Übersetzungen ins französische.
Da wird zuerst denglisch draus gemacht und dann wird versucht, dies ins französische zu übersetzen!
Melden
Matthew
Ich habe neulich eine Diskussion verfolgt. Gockel-Translate basiert wohl auf einem Neuronalen Netzwerk. Und man hat analysiert, was sich aufgrund des Trainings da entwickelt hat.
Dabei hat man angeblich festgestellt, dass das Netzwerk eine eigene "interne Sprache" gebildet hat (allerdings nicht Englisch, sondern etwas Eigenes) es übersetzt zunächst in seine interne Sprache und in einem zweiten Schritt aus dieser internen Sprache in die Zielsprache.
Dadurch werden die Strukturen einfacher.
Wenn man 100 Quell- und Zielsprachen hat, dann brächte mann 100*99=9.900 verschiedene Übersetzungsmodule. Eins für jede Kombination unterschiedlicher Sprachen. So braucht man nur 200. 100 für von jeder Sprache in die Interne und weitere 100 für die Übersetzung von der internen in die 100 Zielsprachen. Auch wird es viel einfacher eine zusätzliche Sprache hinzuzufügen.
Ich habe da aber jetzt keine belastbare Quelle zu.
Melden
Deho
@ Matthew

Meinst Du etwa dieses hier? Da kann es m.E. bleiben. Sooo einfach sind Sprachregeln schon in direkter Übersetzung nicht, und über Umwege wird es nicht einfacher.
Melden
Matthew
Dara, das war eigentlich keine spekulative Diskussion, wie es eventuell gehen könnte, sonderen es ging um eine Veröffentlichung angeblich von Gockel, dass sie das Neuronale Netz nach dem Training analysiert haben und dabei tatsächlich eine solche Struktur gefunden hätten.

Es ist also auch keine Struktur, die künstlich so designed worden wäre, sondern die sich im Neuronalen Netz, gewissermaßen evolutionär entwickelt haben soll.

Dass das nicht ohne Tücken ist, ist klar. Und dass es immer noch nicht unfallfrei funktionuiert, macht ja das Beispiel von Dschinn deutlich.
Melden
Matthew
Eine solche Meta-Sprache müsste nach meiner Einschätzung halbwegs frei von Homonymen (Teekesselchen) sein. Was als Forderung natürlich leicht gesagt ist, aber praktisch (zumindest in einigen Fällen) schwierig umzusetzen sein dürfte. Die Behandlung von Zeiten würde natürlich Schwierigkeiten machen, wenn man aus einer Sprache übersetzt, die dafür nur wenige Ausdrucksmittel hat. Das wäre dann aber ein Problem, dass bei der Übersetzung in jede andere Sprache gleichermaßen besteht.
Melden
bh_roth
@Dara: Schön, dass du mal wieder vorbeischaust.
Melden
DerDoofe
Es gibt Latein und es gibt Esperanto. Beide habe sprachübergreifende Funktion. Um sie verstehen zu können, muss man sie beherrschen. Und das kann der Computer im Jahr 2017 nicht. Ohne eine Sprache, die als Medium dient, wird er es niemals können.
Bis der PC mein Plattdeutsch in grammatisch korrektem Kisuaheli darstellen kann, wird Kalifornien an Japan angedockt haben.
Im engen Sinn übersetzt Google nicht, sondern sucht im Netz nach entsprechenden Äußerungen, die dann ohne jede Rücksicht auf die Grammatik gerührt, geschüttelt und reproduziert werden.
Melden
Tibby
Meines Wissens sind Pubkikationen aller Art, welche in möglichst vielen Sprachen erschienen sind, die Basis für den Google Translator. Die Sätze daraus werden ganz einfach indexiert, wie eine Adresskartei.
Google sucht dann in der Zielsprache nach dem selben Satz. Brute Force Methode.

Ob jetzt noch ein neuronales Netz darauf gebaut wurde, weiss ich nicht.

Mir fällt aber auch auf (bei Übersetzungen aus dem Spanisch) dass die englischen Übersetzung wesentlich besser sind als die deutschen.
Und wenn grammatikalisch korrekte Sätze eingegeben werden (und nicht etwa Chatroom-Slang oder sowas) sind die Übersetzungen durchaus akzeptabel.
Dies gilt auch für Englisch nach Spanisch, wie ich von meinen Freunden so höre.
Melden
Btill
Wer Lust hat, sich das Problem noch mal mit Witz demonstrieren zu lassen, dem empfehle ich dieses Video von Stevie T: https://youtu.be/HUqF3fOOc_w
Da sind ein paar Perlen dabei.
Melden
Matthew
Ganze Sätze wohl eher nicht, aber der Ansatz mit einer "Phrasen-Datenbank", also Wortfolgen statt einzelner Worte zu übersetzen, davon habe ich vor 10 bis 15 Jahren das erste Mal gehört. Bei Dokumenten in Firmen kommt es auch häufiger vor, das ein bestehender Text überarbeitet wird, und sich nur wenig ändert oder dass immer gleichlautende Textbausteine verwendet werden.

Wenn dann die alte Text-Version noch gespeichert ist, lässt sich die Übersetzung aus der Phrasen-Datenbank ganz gut automatisiert hinbekommen und nur die neuen Text-Passagen wurden einem menschlichen Übersetzer vorgelegt.

In den letzten Jahren experimentiert man aber mit anderen Ansätzen. Zum Beispiel ist es schon ziemlich hilfreich, wenn man analysieren kann, dass der Satz "Kevin isst einen Apfel." und "Charlotte isst eineBanane" die gleiche Aussage, nur für andere Objekte trifft.

Es gibt Firmen, die sich darauf spezialisiert haben, für eng umgrenzte Themengebiete Texte automatisch zu erstellen. Z.B. für Sport- oder Börsennachrichten funktioniert das schon sehr gut. Die Daten wandern in einer sehr formalisierten Form aus einer Datenbank in den Text-Generator und man kann bei Sport-Nachrichten sogar auswählen aus Sicht welcher Mannschaft der Artikel geschrieben werden soll und wie ausführlich, ob sachlich oder emotional.

Einen Text der nicht so formalisiert vorliegt. sondern erst einmal geparst werden muss (und dann vielleicht noch Fehler enthält) zu übersetzen, ist dann allerdings schon eine andere Liga. Ich kenne die Technik bei Gockel nicht aus eigener Anschauung, habe aber schon öfter gehört, dass die mit einem sehr umfangreichen Neuronalen Netz arbeiten. Und es spricht ja auch nichts dagegen, ein solches Netz mit einer Phrasen-Datenbank zu kombinieren.

In meinem Bekannenkreis gibt es eine Linguistin, die auf dem Gebiet der Maschinenübersetzung arbeitet und die sich dazu mit Head driven Phrase Structure Grammar beschäftigt. Ich hab's aber nicht wirklich verstanden.
Melden