Themenspecial 07. Juni 2024
Themenspecial: Künstliche Intelligenz (mit Michael Förtsch von 1E9) 👾
Alles zum Themenspecial

Wie soll sichergestellt werden, dass KI Menschen gegenüber nicht gefährlich werden kann?

2 Antworten

Eine berechtigte Frage. Derzeit geschieht dies vor allem durch sogenanntes Red Teaming und Alignment. Bei ersterem versuchen Menschen, die sich gut mit KI-Systemen auskennen, eine noch in der Entwicklung befindliche KI dazu zu bringen, eigentlich unerwünschte Dinge zu tun: zum Beispiel Anleitungen zum Bombenbau zu schreiben oder chemische Waffen zu entwerfen. Genau dieses unerwünschte Verhalten wird einer KI dann „abtrainiert“. Dazu erhalten große Sprachmodelle hinter Chatbots wie ChatGPT einen sogenannten Systemprompt, der auch Verhaltensrichtlinien vorgibt.

Dem Chatbot Claude wurde etwa eine Art Verfassung mitgegeben, an die er sich halten soll.

Hier gibt’s mehr dazu: https://www.anthropic.com/news/collective-constitutional-ai-aligning-a-language-model-with-public-input

Für gefährlichere KI-Systeme, wie sie zur Steuerung bewaffneter Drohnen eingesetzt werden, gibt es ähnliche Sicherheitsverfahren. Darüber hinaus gibt es aber auch Notabschaltungen und Möglichkeiten, etwa eine fehlgeleitete Drohne aus der Ferne zu sprengen.

In der EU wurde zudem kürzlich der sogenannte AI Act verabschiedet. Dieser schreibt Entwicklern vor, beispielsweise offenzulegen, wie und womit ihre KI-Systeme trainiert werden, und verbietet auch bestimmte KI-Systeme.

Es gibt auch Forschergruppen, die für ein festes Regelwerk für Künstliche Intelligenz plädieren. Ähnlich den Robotergesetzen, die Isaac Asimov einst definierte. Unklar ist allerdings noch, wie ein solches Regelwerk aussehen könnte und wie es KI-Systemen so eingepflanzt werden kann, dass sie sich tatsächlich daranhalten. Denn zumindest bisher ist es immer wieder gelungen, KIs dazu zu „überreden“, die ihnen gesetzten Grenzen zu ignorieren.

Wie soll sichergestellt werden, dass KI Menschen gegenüber nicht gefährlich werden kann?

Gar nicht. Es ist der Sinn von KI in Waffensystemen, Menschen gefährlich zu werden.

Alex