Tabnine führt Funktion zur Kennzeichnung unlizenzierten Codes in KI-generierter Software ein

Neues Feature schützt Entwicklungsteams vor Urheberrechtsverletzungen bei der Arbeit mit beliebten KI-Sprachmodellen (LLM)


TEL AVIV, Israel, Dec. 17, 2024 (GLOBE NEWSWIRE) -- Tabnine, Begründer der Kategorie KI-Code-Assistenten, hat heute Code Provenance and Attribution (Codeherkunft und -zuordnung) vorgestellt. Diese Funktion ermöglicht es Unternehmen, von der Nutzung umfangreicher und beliebter großer Sprachmodelle (Large Language Models (LLMs) für Softwareentwicklungsaufgaben zu profitieren und gleichzeitig das Risiko zu minimieren, dass Code mit restriktiver Lizenz in ihre Codebasis eingeschleust wird.

Die großen Sprachmodelle von Anthropic, OpenAI u.a. werden mit umfangreichen Katalogen von Inhalten und Code trainiert. Diese Inhalte stammen aus öffentlich sichtbaren Quellen, von denen viele nicht frei lizenziert sind. In Kombination mit der Tendenz von LLMs, Inhalte zu generieren, die dem bereits Gesehenen ähneln, kann die Verwendung der Modelle dieser Anbieter zu Risiken im Zusammenhang mit geistigem Eigentum oder Urheberrechtsverpflichtungen führen. Mit Provenance and Attribution vergleicht Tabnine den Code, der mithilfe von KI-Chat oder KI-Agenten generiert wurde, mit öffentlich sichtbarem Code auf GitHub. Tabnine markiert Übereinstimmungen und verweist auf das Quell-Repository sowie dessen Lizenztyp. Diese Informationen erleichtern es Entwicklungsteams, KI-generierten Code zu überprüfen und zu entscheiden, ob die Lizenz des Codes ihren spezifischen Standards und Anforderungen entspricht.

Mit der neuen Funktion Provenance and Attribution wird Tabnine Entwicklungsteams sowie Rechts- und Compliance-Teams leichter unterstützen können, wenn sie eine Vielzahl leistungsstarker Modelle nutzen möchten.

„Modelle, die mit größeren Datensätzen trainiert wurden, die wiederum nicht aus Open-Source-Code mit großzügigeren Lizenzen stammen, können eine bessere Leistung bieten. Unternehmen, die diese Modelle nutzen, laufen jedoch Gefahr, Rechte in Bezug auf geistiges Eigentum und Urheberrechte zu verletzen“, erklärt Peter Guagenti, President bei Tabnine. „Unsere Funktion hinsichtlich Codeherkunft und -zuordnung löst dieses Problem, indem sie die Produktivität steigert, ohne die Compliance zu gefährden. Erfahrene Engineering-Teams erwarten, dass sie die Quelle und die Lizenz des generativen KI-Ergebnisses kennen. Diese Funktion stellt nun sicher, dass sie dies auch tun“.

Da die Urheberrechte für die Nutzung von KI-generierten Inhalten noch ungeklärt sind, zielt Tabnine mit seinem proaktiven Ansatz darauf ab, das Risiko der Verletzung von Rechten des geistigen Eigentums bei der Nutzung von Unternehmensmodellen – wie beispielweise Claude von Anthropic, GPT-4o von OpenAI's und Command R+ von Cohere – für die Softwareentwicklung drastisch zu reduzieren.

Das lizenzkonforme Modell von Tabnine, Tabnine Protected 2, das ausschließlich auf Code trainiert wird, der unter einer freieren Lizenz steht, bleibt ein wichtiges und unverzichtbares Angebot von Tabnine. Viele Unternehmen sind der Ansicht, dass allein die Verwendung eines LLM, das auf nicht lizenzierter Software trainiert wurde, ein Risiko darstellen könnte. Aus diesem Grund wird Tabnine dieses einzigartige Modell weiterhin unterstützen und weiterentwickeln. Die neue Funktion Provenance and Attribution bietet Unterstützung für Rechts- und Compliance-Teams, die mit einer größeren Vielfalt von Modellen vertraut sind, solange sie nicht explizit unlizenzierten Code einfügen.

Die Funktion „Code Provenance and Attribution“ unterstützt das gesamte Spektrum der Softwareentwicklung in Tabnine, einschließlich Codegenerierung, Fehlerbehebung im Code, Generierung von Testfällen, Implementierung von Jira-Problemen und vieles mehr. Da Tabnine den Code wie ein Mensch liest, erkennt und markiert Tabnine nicht nur Ergebnisse, die exakt mit Open-Source-Code auf GitHub übereinstimmen, sondern auch, wenn es sich um funktionale Übereinstimmungen oder um Übereinstimmung hinsichtlich der Implementierung handelt.

Tabnine plant in naher Zukunft eine Funktion hinzuzufügen, die es Nutzern ermöglicht, bestimmte Repositories zu identifizieren, z.B. solche, die von Wettbewerbern verwaltet werden. Tabnine wird dann auch den generierten Code mit diesen Repositories abgleichen. Darüber hinaus plant Tabnine, eine Zensurfunktion hinzuzufügen, die es den Administratoren von Tabnine ermöglicht, den betroffenen Code zu entfernen, bevor dieser dem Entwickler angezeigt wird.

Code Provenance and Attribution befindet sich in Private Preview, ist für alle Tabnine-Kunden zugänglich und funktioniert mit allen verfügbaren Modellen, einschließlich Anthropic, OpenAI, Cohere, Llama, Mistral und Tabnine. Weitere Informationen zu Code Provenance and Attribution finden Sie hier.

Über Tabnine
Tabnine unterstützt Entwicklungsteams jeder Größe dabei, künstliche Intelligenz (KI) zu nutzen, um den Softwareentwicklungszyklus zu beschleunigen und zu verbessern. Als erster KI-Code-Assistent wurde Tabnine bereits von Millionen von Entwicklern weltweit eingesetzt, um die Codequalität und die Zufriedenheit der Entwickler mithilfe generativer KI zu verbessern. Im Gegensatz zu anderen Programmierassistenten haben Sie bei Tabnine die Kontrolle über die KI. Diese ist umfassend auf Ihr Entwicklungsteam zugeschnitten, privat und sicher (sie läuft problemlos in Ihren kontrollierten Umgebungen), speichert oder trainiert niemals den Code Ihres Unternehmens oder Benutzerdaten und bietet Modelle, die ausschließlich auf Open-Source-Code mit offenen Lizenzen trainiert wurden, um Risiken im Zusammenhang mit geistigem Eigentum auszuschließen. Weitere Informationen finden Sie auf unserer Website unter tabnine.com. Gerne können Sie uns auch auf LinkedIn folgen.

Contact
press@tabnine.com