Build-Log · On-Device-KI

Wie ich Hintergrundentfernung in einem Windows-Tool gebaut habe — und warum nichts deinen Rechner verlässt.

Jedes „Hintergrund entfernen"-Tool, das ich probiert habe, lädt dein Bild erst auf einen Server. Für ein Screenshot-Tool ist das verkehrt herum — deine Screenshots sind das Privateste auf deinem Bildschirm. Also habe ich meins so gebaut, dass es zu 100% auf deinem Rechner läuft. Hier ist, wie — und der ehrliche Teil: die KI ist nicht der schwierige Part.

Was niemand über „KI-Hintergrundentfernung" sagt

Die meisten Tools, die einen Hintergrund freistellen, schicken dein Bild an ihren Server, rechnen das Modell dort und schicken das Ergebnis zurück. Für ein Stockfoto okay. Für einen Screenshot nicht — der ist meistens ein halbfertiges Feature, Kundendaten, ein API-Key, den du zu schwärzen vergessen hast, oder eine DM, die nur für eine Person gedacht war. Ich wollte nicht, dass irgendetwas davon den Rechner verlässt. Also läuft die Freistellung in ShotsGlow lokal, auf deiner eigenen GPU. Nichts wird hochgeladen. Es gibt gar keinen Server, an den man es überhaupt schicken könnte.

Der ehrliche Teil: das Modell ist nicht meins

Lass mich das „proprietäre KI"-Ding gleich abräumen. Das Modell ist BiRefNet — ein offenes Freisteller-Modell, das jeder herunterladen kann. LocalBG, MadPeel und eine Handvoll andere nutzen exakt dasselbe. Würde ich dir erzählen, die KI sei meine Geheimzutat, hättest du recht, den Tab zuzumachen.

Die eigentliche Arbeit war der unglamouröse Teil: dieses Modell nativ in einer Windows-App laufen zu lassen, im Capture-Flow, ohne dass etwas den Rechner verlässt — und dafür zu sorgen, dass es auf einem normalen PC funktioniert, nicht nur auf meiner Dev-Maschine.

Wie es tatsächlich läuft

  • ONNX Runtime, Modell mit der App gebündelt (~928 MB). Der Trade-off ist ein dicker einmaliger Download statt einer Server-Abhängigkeit für immer. Nehme ich jederzeit.
  • GPU über DirectML, CPU-Fallback. Läuft auf der GPU, wo eine da ist, und fällt auf die CPU zurück, wo nicht — langsamer, aber es läuft. „Läuft auf jedem Windows-Rechner" schlägt „schnell auf meinem".
  • Keine NPU-Behauptungen. Ich habe Support für die Copilot+-Neural-Chips angelegt und dann ausgeschaltet gelassen, weil er noch nicht ausgeliefert wird. Was ausgeliefert wird, ist GPU→CPU. Lieber untertreiben, als eine Angabe auf die Schachtel schreiben, die nicht stimmt.

Und weil kein Server in der Schleife hängt, läuft es auch mit ausgeschaltetem WLAN. Hier mit Flugmodus an — dieselbe Ein-Klick-Freistellung, nichts hochgeladen, weil es nirgendwohin zu laden gibt:

Warum „lokal" auch der Grund ist, dass es einmalig 9 $ kostet

Den Teil habe ich nicht kommen sehen. On-device zu gehen hat nicht nur die Privatsphäre gelöst — es ist der ganze Grund, warum ich das einmal verkaufen kann, statt es dir für immer zu vermieten.

Cloud-KI heißt GPU-Server. GPU-Server heißt eine Rechnung jeden Monat, solange irgendwer das Feature nutzt. Die einzige Art, die zu decken, ist ein Abo — und genau deshalb fängt jedes Cloud-Tool irgendwann an, sich dir zu vermieten.

On-device macht deine Hardware die Arbeit. Kein Server, also keine Monatsrechnung, also muss ich dir nichts monatlich berechnen. Die Privatsphäre-Entscheidung und die Preis-Entscheidung waren am Ende dieselbe Entscheidung: lass es auf deinem Rechner — und „9 $ einmalig, kein Abo" ist kein Marketing-Spruch mehr, sondern einfach die Rechnung.

Wenn du dasselbe baust

  • Bündle das Modell; sei ehrlich über die Größe, statt einen 900-MB-Download beim ersten Start zu verstecken.
  • DirectML + CPU-Fallback ist der pragmatische Windows-Weg. Jag der NPU nicht hinterher, bis sie für genug Leute real ist.
  • Das Modell ist Massenware. Das Produkt ist alles drumherum — die native Aufnahme, der Editor, die Schwärzung, die einen Crop übersteht, die Export-Formate. Da steckt die Arbeit, und der eigentliche Moat.

Ich habe das in ShotsGlow eingebaut — ein natives Windows-Screenshot-Tool, das aufnimmt, gestaltet, beschriftet, schwärzt und Hintergründe lokal freistellt und dann in 30 Formate für Social und App Store exportiert. 9 $ einmalig, kein Abo, nichts wird hochgeladen. Ich baue es öffentlich als Solo-Windows-Entwickler — wenn du den Rest der Geschichte willst, die Startseite hat sie.