|
DeepSeek ist ein chinesisches Startup, welches sich auf die
Entwicklung fortschrittlicher KI spezialisiert hat.
DeepSeek wurde international bekannt mit der
Veröffentlichung seines Modells DeepSeek R1, das mit etablierten
KI-Systemen wie ChatGPT von OpenAI und Claude von Anthropic konkurriert...
DeepSeek verfolgt das strategische Ziel, eine
leistungsfähige und wettbewerbsfähige Alternative zu westlichen
KI-Lösungen bereitzustellen und gleichzeitig die
technologische Souveränität
Chinas zu stärken.
Bereits in der frühen Phase seiner Existenz
konnte das Unternehmen erhebliche finanzielle Unterstützung aus der
chinesischen Technologiebranche sowie
aus staatlich geförderten Innovationsprogrammen gewinnen.
Ausrichtung auf Open-Source...
Die Forschungsergebnisse und Modelle des
Unternehmens werden immer unter Open-Source-Lizenzen
veröffentlicht.
Dies ist Teil der Unternehmenskultur und man hat
nicht die Absicht, dies in Zukunft zu ändern.
So ist das Modell kostenfrei für reguläre
Nutzer zugänglich und richtet sich an eine breite Anwenderschaft, um den
offenen Zugang zu modernster KI-Technologie zu fördern.
Damit setzt das Unternehmen bewusst einen Kontrast
zu zahlreichen proprietären KI-Systemen, die durch restriktive
Lizenzen gekennzeichnet sind.
...und energiesparsam
DeepSeek hat seine KI-Modelle so optimiert,
dass der Energieverbrauch im Vergleich zu traditionellen, energieintensiveren
KI-Modellen um bis zu 70% gesenkt werden kann, was durch effizientere
Algorithmen und spezialisierte Hardware ermöglicht wird.
Wie alles begann
Im Jahr 2015 wurde der Hedgefonds High-Flyer von
drei Ingenieuren der Universität Zhejiang gegründet, die während
der Weltfinanzkrise 20072008 als Studenten erste Erfahrungen im
Aktienhandel gesammelt hatten.
High-Flyer etablierte sich schnell als innovativer
Akteur im Finanzsektor, indem die Firma Maschinelles Lernen zur Optimierung von
Handelsstrategien einsetzte und ein KI-gestütztes Modell für den
Hochfrequenzhandel entwickelte.
Im Jahr 2021 startete Liang Wenfeng, einer
der drei High-Flyer-Gründer, eine Forschungsgruppe für
Grundlagenforschung in KI, die als Nebenprojekt von High-Flyer finanziert
wurde.
Im April 2023 gab einer der Gründer, Liang
Wenfeng, die Ausgründung der Forschungsinitiative als
unabhängiges Unternehmens für künstliche Intelligenz namens
DeepSeek bekannt.
Ziel dieses Unternehmens ist die Entwicklung und
Vermarktung einer universellen künstlichen Intelligenz, basierend auf
einem umfangreichen, eigens entwickelten Sprachmodell.
Vor dem Hintergrund der von den USA verhängten
Exportbeschränkungen gegen China, die die Einfuhr leistungsfähiger
Beschleuniger für das Training Künstlicher Intelligenz
begrenzten, wurden Anreize geschaffen, möglichst effiziente KI-Modelle zu
entwickeln.
Technologie
Am 20. Januar 2025 präsentierte DeepSeek
das Large Language Model DeepSeek-R1, das auf Maschinelles Lernen basiert und
eine Architektur verwendet, die mit den gängigen Transformer-Modellen
vergleichbar ist.
DeepSeek-R1 wurde unter der MIT-Lizenz
veröffentlicht, die uneingeschränkten Open Access fördert und
kommerzielle als auch akademische Nutzungen ohne Einschränkungen
erlaubt.
Es gibt Zweifel daran, ob DeepSeek die Modelle
vollständig selbst trainiert hat, oder ein bereits fertig trainiertes
ChatGPT als Hilfemittel nutzte, um die Trainingszeit zu verkürzen.
Mit Janus-Pro hat DeepSeek am 27. Januar 2025 ein
neues multimodales KI-Modell veröffentlicht, das unter der MIT-Lizenz als
Open Source verfügbar ist.
Das Modell kombiniert Fähigkeiten, die sowohl
DALL-E als auch Stable Diffusion ähneln, und kann Bilder
erzeugen sowie analysieren.
Es wurde mit Fokus auf präzise
Interpretationsfähigkeiten, effiziente Architektur und optimierte
Ressourcenverwendung entwickelt.
Dem Gründer von DeepSeek, Liang Wenfeng,
werden enge Verbindungen zur Kommunistischen Partei zugeschrieben.
Kritiker äußern Bedenken, weil das
KI-System potenziell für ausländische Einflussnahme, Desinformation,
Überwachung und zur Entwicklung von Cyberwaffen, wie beispielsweise neuen
Hacking-Tools für den chinesischen Geheimdienst, verwendet werden
könnte.
Zudem warnen Datenschützer (ähnlich wie
bei TikTok), dass die App persönliche Daten nach China
übermittelt.
. |