Twitter will härter gegen Hass, Belästigungen und Sexismus vorgehen

Dank einer durchgesickerten internen Mail von Twitter werden geplante Änderungen in der Moderationspolitik des Unternehmens öffentlich. Das soziale Netzwerk will in den kommenden Wochen die Regeln verschärfen.

Ein Symbolbild für Hass
Hassrede gibt es auch auf Twitter (Symbolbild) CC-BY 2.0 K-Screen Shots

Twitter kündigt an, in den nächsten Wochen schärfere Regeln im Hinblick auf Hassrede, Belästigungen und Sexismus zu veröffentlichen und durchzusetzen. Kritiker halten dem soziale Netzwerk seit längerem vor, dass es solchen Inhalten Raum gebe und zu wenig dagegen vorgehe. Andere Stimmen betonen die Free-Speech-Haltung des Unternehmens.

Die neuen Regeln hatte Twitter-Chef Jack Dorsey kürzlich angekündigt. Auf die Tweets des Chefs folgte eine interne Mail des Unternehmens, die das US-Magazin Wired öffentlich machte. Laut dieser Mail sollen zum Beispiel Nacktbilder, die ohne Einverständnis entstanden sind, von der Plattform verschwinden. Auch will Twitter die Schraube in Sachen Pornografie anziehen.

Außerdem sollen bestimmte mit Hassrede verbundene Symbole in Zukunft als „sensible Inhalte“ eingestuft werden. Der Terminus war bislang für Pornografie und Bilder von Gewalt vorbehalten. Verschwinden sollen mit der neuen Policy nicht nur wie bislang Morddrohungen, sondern auch Tweets, die Gewalt verherrlichen.

Overblocking und Algorithmen?

In der geleakten Mail wird davon ausgegangen, dass eher zuviel als zu wenig gelöscht werden könnte. Overblocking könnte sich grundsätzlich als Problem bei der Moderation von Twitter erweisen. Das Unternehmen, das bislang nur Verluste einfährt, könnte nämlich gezwungen sein, deutlich mehr auf automatisierte, algorithmische Moderationsentscheidungen zu setzen als dies zum Beispiel bei Facebook der Fall ist. Damit stiege zumindest die Gefahr, dass der Kontext der gelöschten Nachricht nicht erkannt wird.

Gleichzeitig versucht Twitter noch einen anderen Spagat: Verstoßen Tweets gegen die Unternehmensregeln, haben aber einen hohen Nachrichtenwert, dann sind diese wieder erlaubt. Entzündet hatte sich dieser Streit an Tweets von US-Präsident Trump, der Nordkorea mit Gewalt drohte.

In Deutschland wird zudem spannend, wie Twitter die Vorgaben des Netzwerkdurchsetzungsgesetzes umsetzen wird. Das umstrittene Gesetz fordert von Unternehmen eine Löschung „offensichtlich rechtswidriger Inhalte“ innerhalb von 24 Stunden. Kritiker befürchten eine privatisierte Rechtsdurchsetzung und eine Gefahr für die Meinungsfreiheit durch Overblocking.

Die interne Twitter-Mail im Originaltext:

Dear Trust & Safety Council members,

I’d like to follow up on Jack’s Friday night Tweetstorm about upcoming policy and enforcement changes. Some of these have already been discussed with you via previous conversations about the Twitter Rules update. Others are the result of internal conversations that we had throughout last week.

Here’s some more information about the policies Jack mentioned as well as a few other updates that we’ll be rolling out in the weeks ahead.

Non-consensual nudity

  • Current approach *We treat people who are the original, malicious posters of non-consensual nudity the same as we do people who may unknowingly Tweet the content. In both instances, people are required to delete the Tweet(s) in question and are temporarily locked out of their accounts. They are permanently suspended if they post non-consensual nudity again.
  • Updated approach *We will immediately and permanently suspend any account we identify as the original poster/source of non-consensual nudity and/or if a user makes it clear they are intentionally posting said content to harass their target. We will do a full account review whenever we receive a Tweet-level report about non-consensual nudity. If the account appears to be dedicated to posting non-consensual nudity then we will suspend the entire account immediately.

*Our definition of “non-consensual nudity” is expanding to more broadly include content like upskirt imagery, “creep shots,” and hidden camera content. Given that people appearing in this content often do not know the material exists, we will not require a report from a target in order to remove it.

*While we recognize there’s an entire genre of pornography dedicated to this type of content, it’s nearly impossible for us to distinguish when this content may/may not have been produced and distributed consensually. We would rather error on the side of protecting victims and removing this type of content when we become aware of it.

Unwanted sexual advances

  • Current approach *Pornographic content is generally permitted on Twitter, and it’s challenging to know whether or not sexually charged conversations and/or the exchange of sexual media may be wanted. To help infer whether or not a conversation is consensual, we currently rely on and take enforcement action only if/when we receive a report from a participant in the conversation.
  • Updated approach *We are going to update the Twitter Rules to make it clear that this type of behavior is unacceptable. We will continue taking enforcement action when we receive a report from someone directly involved in the conversation. Once our improvements to bystander reporting go live, we will also leverage past interaction signals (eg things like block, mute, etc) to help determine whether something may be unwanted and action the content accordingly.

Hate symbols and imagery (new)*We are still defining the exact scope of what will be covered by this policy. At a high level, hateful imagery, hate symbols, etc will now be considered sensitive media (similar to how we handle and enforce adult content and graphic violence). More details to come.

Violent groups (new)*We are still defining the exact scope of what will be covered by this policy. At a high level, we will take enforcement action against organizations that use/have historically used violence as a means to advance their cause. More details to come here as well (including insight into the factors we will consider to identify such groups).

Tweets that glorify violence (new)*We already take enforcement action against direct violent threats (“I’m going to kill you”), vague violent threats (“Someone should kill you”) and wishes/hopes of serious physical harm, death, or disease (“I hope someone kills you”). Moving forward, we will also take action against content that glorifies (“Praise be to for shooting up. He’s a hero!”) and/or condones (“Murdering makes sense. That way they won’t be a drain on social services”). More details to come.

We realize that a more aggressive policy and enforcement approach will result in the removal of more content from our service. We are comfortable making this decision, assuming that we will only be removing abusive content that violates our Rules. To help ensure this is the case, our product and operational teams will be investing heavily in improving our appeals process and turnaround times for their reviews.

In addition to launching new policies, updating enforcement processes and improving our appeals process, we have to do a better job explaining our policies and setting expectations for acceptable behavior on our service. In the coming weeks, we will be:

  • updating the Twitter Rules as we previously discussed (+ adding in these new policies)
  • updating the Twitter media policy to explain what we consider to be adult content, graphic violence, and hate symbols.
  • launching a standalone Help Center page to explain the factors we consider when making enforcement decisions and describe our range of enforcement options launching new policy-specific Help Center pages to describe each policy in greater detail, provide examples of what crosses the line, and set expectations for enforcement consequences
  • Updating outbound language to people who violate our policies (what we say when accounts are locked, suspended, appealed, etc).

We have a lot of work ahead of us and will definitely be turning to you all for guidance in the weeks ahead. We will do our best to keep you looped in on our progress.

All the best,

Head of Safety Policy

Deine Spende für digitale Freiheitsrechte

Wir berichten über aktuelle netzpolitische Entwicklungen, decken Skandale auf und stoßen Debatten an. Dabei sind wir vollkommen unabhängig. Denn unser Kampf für digitale Freiheitsrechte finanziert sich zu fast 100 Prozent aus den Spenden unserer Leser:innen.

2 Ergänzungen

  1. Würde das auch in dem Sinne gelten, dass wenn man z.B. ein Video als Anschauungsmaterial teilt, welches zwar selbst als negativ zu betrachten ist, jedoch anhand dieses Videos man auf Dinge hinweisen möchte, die z.B. im zeithistorischen Kontext anzusiedeln sind, um damit ggf. auch auf aktuelle Ereignisse hinzuweisen, und damit anhand dieses kritischen Materials genau das Gegenteil bezweckt, als das Video für sich darstellt? Als Beispiel könnte etwa folgendes Video aus den 1990er Jahren dienen, in denen sich Menschen aus Sachsen über Ausländer äußern:

    1. Selbstverständlich.
      Den Hintersinn von Informationen zu erkennen ist für Computer unmöglich. Selbst der Mensch stösst da ständig an die Grenzen seiner Fähigkeit.

      1. Was kann ich wissen?
      2. Was soll ich tun?
      3. Was darf ich hoffen?
      4. Was ist der Mensch?
      5. Warum kommt meine Ironie nie durch?

      Sind schon seit altersher die Kernfragen des menschlichen Seins.

Dieser Artikel ist älter als ein Jahr, daher sind die Ergänzungen geschlossen.