Undisruptable Technology logo

Undisruptable Technology

Subscribe
Archives
October 17, 2025

Data needs a lot of care [Undisruptable Technology - Ausgabe #291]

#291, 17. Oktober 2025

Guten Morgen,

der wöchentliche Bitkom-Podcast meines Kollegen Tobias Grimm “Tech Weekly” ist ja eigentlich immer hörenswert, aber heute ganz besonders. Denn Bettina Lange von der Bitkom Research erzählt darin vorab etwas über ein neues Projekt, das Montag online geht: Das Bitkom Dataverse. Eine Online-Plattform, die Zugriff auf die vielen Daten ermöglicht, die wir als Digitalverband Jahr für Jahr in Umfragen oder mit Marktstatistiken erheben. Und ein klitzekleines Stück von der Dataverse-Plattform kommt auch von mir, nämlich die Suchfunktion.

Das klingt ein bisschen trivial (und am Ende ist es das auch), aber die Suche ist natürlich KI-gestützt und dabei stellt sich das Problem, dass wenn man ein RAG mit einer vektorbasierter Suche davor schaltet, das mit Text recht gut funktioniert, mit strukturierten Daten aber eher so mäh. Aber es gibt ja für alles einen Weg und deshalb bekommt man jetzt sowohl bei Stichworten wie “Digitale Souveränität” als auch bei ganz konkreten Fragen wie “Wie viele Senioren nutzen Online-Dating?” ganz passable Ergebnisse und landet direkt bei den richtigen Daten-Reports. Und jetzt hoffe ich, dass das alles am Montag auch seinen ersten Test unter Realbedingungen gut meistert. Bis es soweit ist können wir ja alle noch “Data Data” hören: “Data, data, it's my addiction / I can't get enough, I need a data prediction / But data governance needs to be there / Because data needs a lot of care.”

KI ist auch bei den heutigen 10+ Links rund um digitale Disruptionen und analoge Absonderlichkeiten häufiger vertreten. Vom bald möglichen Sexting mit der KI bis zur Frage, wie viel Wissen eigentlich verloren geht, wenn wir uns bei Fragen zu allen Dingen des Lebens künftig auf ChatGPT, Gemini & die anderen verlassen. Aber es geht natürlich auch um andere Themen wie zum Beispiel ein spannendes Stück das erklärt, wie halbseidene Firmen relativ leicht den Standort eines Handys ermitteln können, ohne dazu aufwändig Spyware auf dem Gerät zu installieren. Ich wünsche viel Spaß und maximale Erkenntnisgewinne beim Lesen.

Bis nächste Woche,

Andreas Streim


Ten news that fit to send

  1. Two Months Ago, Sam Altman Was Boasting That OpenAI Didn’t Have to Do Sexbots. Now It’s Doing Sexbots: KI hat aktuell ein kleines Problem: Die Anbieter der LLMs verdienen damit weniger Geld als sie in die Technologie reinstecken (müssen). Da gibr es eigentlich nur drei Möglichkeiten: Drogen, Glücksspiel oder Sex. OpenAI entscheidet sich für Option 3: ““As part of our ‘treat adult users like adults’ principle, we will allow even more, like erotica for verified adults,” Altman tweeted on Tuesday, confirming once and for all that the ChatGPT maker would double down on sexbots.” Jetzt gab es bisher auch schon Sprachmodelle, die das mehr oder weniger zugelassen haben, aber künftig werden wir wohl noch mehr solcher “Produkte” begegnen. “The Verge” hat das Thema auch aufgegriffen: “OpenAI also announced the formation of a council on “well-being and AI” to help shape OpenAI’s response to “complex or sensitive” scenarios. The council is comprised of a team of eight researchers and experts who study the impact of technology and AI on mental health.”

  2. Walmart teams up with OpenAI to allow purchases directly in ChatGPT: Vielleicht für das Thema Monetisierung genauso wichtig wie “Sex sells” ist überhaupt “Sells”. “Walmart
    said Tuesday it has struck a deal with OpenAI to allow shoppers to make faster purchases directly through artificial intelligence chatbot ChatGPT. With the move, the retail giant and largest U.S. grocer is trying to keep up with changes in how consumers discover items to buy. Along with purchasing items they see on social media or products recommended by retailers, shoppers are increasingly going to ChatGPT or similar AI chatbots for gift ideas or help finding the best deals.”

  3. Data Poisoning bei LLMs: Feste Zahl Gift-Dokumente reicht für Angriff: Dazu passt doch diese Studie ganz gut, die erläutert, wie man Hintertüren in Sprachmodelle einbauen kann - und dass das gar nicht so schwer ist, selbst in großen Modellen. “Die zentrale Erkenntnis der Studie ist, dass die für einen erfolgreichen Angriff benötigte Anzahl an vergifteten Dokumenten nicht mit der Größe des Modells oder des Datensatzes ansteigt. Die Experimente zeigten, dass bereits 250 Dokumente ausreichten, um in allen getesteten Modellgrößen zuverlässig eine funktionierende Hintertür zu implementieren, während 100 Beispiele noch keine robuste Wirkung zeigten. Selbst das 13-Milliarden-Parameter-Modell, das auf einem 260 Milliarden Token umfassenden Datensatz trainiert wurde, fiel auf diese geringe Anzahl herein. Diese 250 Dokumente machten gerade einmal 0,00016 % der gesamten Trainings-Tokens aus, was zeigt, dass die immense Menge an sauberen Daten die Wirkung des Gifts nicht neutralisieren konnte.”

  4. Holes in the web: Was weiß KI eigentlich von der Welt? Glaubt man der These diesen Textes, dann erschreckend wenig - was ein Problem wird, wenn immer mehr Menschen Antworten auf alle Fragen des Lebens bei ChatGPT & Co. suchen. “When AI systems lack adequate exposure to a language, they have blind spots in their comprehension of human experience. For example, data from Common Crawl, one of the largest public sources of training data, reveals stark inequalities. It contains more than 300 billion web pages spanning 18 years, but English dominates with 44 per cent of the content. What’s even more concerning is the imbalance between how many people speak a language in the physical world and how much that language is represented in online data. Take Hindi, for example, the third most spoken language globally, spoken by around 7.5 per cent of the world’s population. It accounts for only 0.2 per cent of Common Crawl’s data.” Aber was bedeutet das in der Praxis? Nur ein Beispiel aus dem Text, der sich wirklich lohnt zu lesen: “It should not come as a surprise that a growing body of studies shows how LLMs predominantly reflect Western cultural values and epistemologies. They overrepresent certain dominant groups in their outputs, reinforce and amplify the biases held by these groups, and are more factually accurate on topics associated with North America and Europe. Even in domains such as travel recommendations or storytelling, LLMs tend to generate richer and more detailed content for wealthier countries compared with poorer ones".”

  5. How First Wap Tracks Phones Around the World: Das ist echt eine spannende Geschichte über eine Firma, die Menschen für andere trackt, also deren Standort herausfindet. Aber vor allem, wie das technisch geht - nämlich mit Hilfe von im Telekommunikationsprotokoll vorgesehenen, unsichtbaren Nachrichten - die zu einer Zeit entwickelt wurden, als Security kein Thema war. Und die man nicht einfach so entfernen kann. “Among the most heavily featured numbers we came across Anne Wojcicki, co-founder of 23andMe and at the time married to Google’s Sergey Brin, who was tracked more than 1,000 times as she moved across the San Francisco Bay Area. We also detected cases where tracking was automated, with timestamps at the same minute of each hour, as was the case for Gianluigi Nuzzi, a well known Italian journalist who had uncovered a corruption scandal inside the Vatican.”

  6. How I Almost Got Hacked By A 'Job Interview': Und weil wir gerade beim Security-Thema sind… Auch wenn es vermutlich die Wenigsten direkt betrifft, weil sie sich nicht als Programmiererin oder Programmierer auf Stellen bewerben, so ist es doch ganz spannend mal zu lesen, wie Cyberkriminelle vorgehen, um sich Zugang zu Daten, Passwörtern oder Code zu verschaffen. “Before hitting npm start, I threw this prompt at my Cursor AI agent:
    "Before I run this application, can you see if there are any suspicious code in this codebase? Like reading files it shouldn't be reading, accessing crypto wallets etc." And holy sh*t.”

  7. Lyft and Tensor Plan Partnership to Make World’s First Consumer-Owned Autonomous Vehicles, Powered by NVIDIA, “Lyft-Ready”: Lange nichts mehr von autonomen Autos gehört? Immerhin ist das kein reines Tesla-Thema, auch wenn es manchmal in der Berichterstattung so wirkt. “Through this collaboration, Tensor's groundbreaking Robocar will become the first personally-owned autonomous vehicle (AV) to become "Lyft-ready" directly from the manufacturer, while Lyft, through its affiliates, has reserved hundreds of Tensor Robocars to purchase for its own fleet operations.” Ach, und Waymo will im nächsten Jahr autonome Taxisfahrten in London und damit erstmals in Europa anbieten.

  8. Jeep software update bricks vehicles, leaves owners stranded: Die Idee ist ja wirklich toll. Statt das Auto in die Werkstatt zu fahren, kann der Hersteller einfach “over the air” ein Software-Update einspielen und das Fahrzeug wird besser oder ein Fehler wird gefixt. Oder es fährt halt nicht mehr. “Some described losing power abruptly whilst driving in the wake of the update. One Jeep owner, Kerry Hollis, who works in IT infrastructure at Wells Fargo, told The Stack: “This was a software change that obviously wasn’t tested thoroughly and was dangerous and could have had life safety implications. “Fortunately, for me, I lost propulsion while going at low speed in my neighborhood, so I was able to pull over, restart and limp back to my home. I’ve read stories of others that weren’t in that situation, going at highway speeds, and in traffic...” Fail fast, fail often ist halt vielleicht doch nicht das beste Motto für den Straßenverkehr.

  9. No Science, No Startups: The Innovation Engine We’re Switching Off: Der Text beschäftigt sich mit der Frage, was die Kürzungen der US-Regierung bei Hochschulen und Wissenschaft für Innovationen bedeuten - und damit auch für Startups. “The output of this university-industry-government science partnership became the foundation of Silicon Valley, the aerospace sector, the biotechnology industry, Quantum and AI. These investments gave us rockets, cures for cancer, medical devices, the Internet, Chat GPT, AI and more. Investment in science is directly correlated with national power. Weaken science, you weaken the long-term growth of the economy, and national defense.”

  10. Crypto Kingpin Turns Up Dead in Lamborghini After Market Crash: Es geht um einen ukrainischen Krypto-Millionär, der nach den letzten Marktturbulenzen tot in seinem Luxusauto aufgefunden wurde. Was an der Geschichte neben dem Crime-Charakter insgesamt für mich spannend war: Die Ukraine ist offenbar ein Krypto-Land, und nicht nur im positiven Sinne. “Whether by suicide or murder, it’s not out of the realm of possibility that Ganich’s death resulted from his role in the pressure cooker that is the Ukrainian crypto scene. Despite being one of the poorest countries in Europe, Ukraine is one of the world leaders in crypto adoption, with tens of billions of dollars worth of the stuff flowing through the nation every year. “Political and economic relations in Ukraine at the highest levels are based on corruption,” one crypto investor told Strana. “In recent years, corruption has shifted to cryptocurrency. Cryptocurrency is the main nerve center of all Ukrainian corruption right now.””

Undisruptable Technology im Bild

See before you're seen.

EagleEye enhances the warfighter’s perception by overlaying digital information onto the real world, delivering vital real-time insights. pic.twitter.com/Yl0tmlhHzd

— Anduril Industries (@anduriltech) October 13, 2025

Was aussieht wie aus dem Trailer für das neue “Battlefield 6” ist eine Technologie, die es Soldatinnen und Soldaten ermöglichen soll, deutlich mehr auf dem Schlachtfeld wahrzunehmen, als es normale Augen erlauben.

Und zuletzt...

Mal was aus der Rubrik “Digitale Souveränität”. Die chinesische Regierung hat erstmals amtliche Dokumente veröffentlicht, die sich nicht mit Microsoft Word öffnen lassen: “For the first time, China’s Ministry of Commerce issued a slew of documents that could be directly accessed only through WPS Office – China’s answer to Microsoft Office – as Beijing continues its tech self-reliance drive. Developed by the Beijing-based software company Kingsoft, WPS Office uses a different coding structure to Microsoft Office, meaning WPS text files cannot be opened directly in Word without conversion. Previously, the ministry primarily released text documents in Microsoft Word format.”

Netter Wink mit dem Zaunpfahl. Setzt aber voraus, dass man überhaupt über eigene Software mit einem eigenen Standard verfügt.

Don't miss what's next. Subscribe to Undisruptable Technology:
GitHub X LinkedIn Mastodon
Powered by Buttondown, the easiest way to start and grow your newsletter.