Welcome to 2018, when machines sound, look, and feel like humans

Es ist schon teilweise gfürchig, wie eine Freundin sagt, wenn man sich die aktuellen Forschungsresultate in der Sprach-Synthese anhört.

Hier eine Seite mit aktuellen Beispielen und vor allem einem Quiz, welche Aufnahme denn von der Maschine und welcher von einem Sprecher stammt.

https://google.github.io/tacotron/publications/tacotron2/

Ich habe darüber ja schon öfters geschrieben, wie auch davon, dass man nun in Realtime anhand bestehender Videoaufnahmen eines Politikers beispielsweise einen kompletten anderen Text samt charakteristischer Aussprache in dessen Lippen legen kann, so dass die Gesichtsmimik und Artikulation zum neuen Text passt.

Das ist auf der einen Seite erschreckend, auf der anderen faszinierend. Mensch kann sich auf die Sinne Sehen und Hören nicht mehr verlassen, das wird dieses Jahr wohl noch mehr kommen. Auf der bequemen Seite ist, dass ein Customer Support Agent mich endlich versteht, dann, wenn es mir eh egal ist, bei was ich mein Anliegen deponiere. Da ist es eventuell sogar besser, ich lasse Ärger bei einem devoten Bot ab, als bei einem Menschen, der womöglich nicht so robust ist und den Frust dann nach Hause in seine Familie bringt ... und meinen Fall aus Rache erst noch miserabel abhandelt.

Wenn ich mir die Hinweise der Cracks des 34C3 durchlese, die man aufgrund der Datengier der Staaten auf unsere externalisierten Gehirne, die SmartPhones, immer mehr Grenzgängern andienen muss ... bin ich dann schon froh, wenn der Grenzbeamte vielleicht "nur" ein KI-Roboter ist ... der seine Regeln emotionslos abarbeitet ...

Link der EFF zu diesem Thema bezüglich Einreise in die USA https://www.eff.org/wp/digital-privacy-us-border-2017

Wer bis jetzt seine Medienkompetenz nicht auf- oder ausgebaut hat, muss sich nun sputen. Ich kann zumindest bei den letzten 4 Gegenüberstellungen nur bei zweien mich auf eine Wahrscheinlichkeit festlegen. Und ich denke, es geht nicht mehr über die Akustik, sondern um die Betonung, die ein Mensch in einen Satz reinlegen kann. Aber wie wir ja auch wissen, betonen wir ja gerade, um etwas Ungeschriebenes akustisch zu transportieren. Wie also könnte ich die Betonung nutzen, um Maschine von Mensch zu unterscheiden. De facto also geht es nicht mehr.

Und eben, visuell geht's bei Standbildern eh auch schon lange nicht mehr, für Video wird's wohl Ende 2018 auch soweit sein.

Mensch wird also auf Mensch zurückgeworfen, bzw. was bin ich, wenn ich künstliche Repräsentationen schon nicht mehr von echten unterscheiden kann.

Dazu kommt noch, dass auch die Interaktion dank KI und DeepL (Maschinenlernen) immer mehr so sein wird, wie wir es von Gegenparts gerade im Business-Bereich gewohnt sind. Also, wenn wir Ende 2018 mit einem Gegenüber via Skype o.ä. kommunizieren ... können wir wohl nicht mehr sicher sein, dass wir einen künstlichen Gesprächspartner erkennen könnten - sofern wir diese Person nicht real schon kennen.

Ich denke übrigens auch nicht, dass KI ein Segen wird ... denn: Schauen wir an, was die sogenannte natürliche Intelligenz auf diesem Planeten zustande bringt ... nun lehrt diese Maschinen, ähnlich zu denken ... was kommt da wohl raus? Genauso Beklopptes wie bei den Natürlichen ...

Die ganze IT ist nach Vorbildern des Menschen gebaut, bisher hatte die IT halt wenig bis keine Eigeninitiative. Die KI wird das können sollen oder müssen - sonst bräuchte man sie ja nicht, wenn man Menschen aus welchen Gründen auch immer Beschäftigung nicht wegnehmen wollte. Die KI bekommt nun aber auch immer mehr Agitatoren als Unterstützung, die Roboter, Drohnen, AR/VR-Brillen und Sensorik für alles und jedes. Konnte die KI ihre Denkresultate bisher nicht gross in die Realworld transportieren, wird sie es dank all dem immer mehr können.

Wohl dem, der noch weiss, wie man ganz ohne Computer in der Welt klar kommt ...?

Ein schönes 2018 wünsche ich.

Kommentare (Kommentar-Moderation ist aktiv. Ihr Kommentar erscheint erst nach Prüfung.)
BlogCFC was created by Raymond Camden. This blog is running version 5.9.8.012. Contact Blog Owner