Technik und Wissenschaft

Tag 3/100: Meistere NLP mit mir!. Tauchen wir ein in die Grundlagen von „named…“ | von aadya dewangan | Dez. 2023

Heute gehen wir zum nächsten Schritt über und verstehen die Erkennung benannter Entitäten oder Ner-Systeme.

Bild, das die Erkennung benannter Entitäten hervorhebt

„Named Entity Recognition“ (NER) mag nach einem komplexen Konzept klingen, aber im Kern geht es darum, Computern beizubringen, Entitäten (wie Namen, Orte und Organisationen) in einem Meer von Texten zu identifizieren und zu klassifizieren. Lassen Sie uns heute das Geheimnis von Ner lüften, indem wir bereits bestehende Systeme erforschen und wie Sie Ihr eigenes System erstellen können.

ner verstehen

Stellen Sie sich vor, Sie lesen einen Nachrichtenartikel über einen Technologieriesen, der ein neues Produkt auf den Markt bringt. ner ist die Technologie, die einem Computer hilft, zwischen regulären Wörtern und Entitäten in diesem Text zu unterscheiden. In unserem Beispiel würde es „Apple“ als Organisation und „iPhone“ als Produkt markieren.

bestehende ner-Systeme

Einige Schwergewichte in Ner haben uns den Weg geebnet. Spacy und NLTK sind wie die Jedi-Meister der Ner-Welt. Es handelt sich um vorgefertigte Systeme, die Texte sofort analysieren und Entitäten identifizieren können. Sie können sie sich als superintelligente Assistenten vorstellen, die Ihnen schnell sagen, wer oder was in einem Dokument erwähnt wird und die einfach in wenigen Zeilen codiert werden können.

Allerdings sind sie nicht immer perfekt, da sie für einen allgemeinen Fall gedacht sind. Wenn Sie ein Modell für einen bestimmten Bereich erstellen müssen, beispielsweise für das Gesundheitswesen, muss Ihr Modell in der Lage sein, Dinge wie Fieber als Symptom und Paracetemol als Medikament zu verstehen. Wie kann das also gemacht werden? Nun, Sie müssten Ihr eigenes Ner-System erstellen.

Mach dir keine Sorgen; es ist nicht so einschüchternd, wie es klingt.

Lesen Sie auch [6/14 News Top 5]OpenAI hat seinen Preis angesichts der harten Konkurrenz gesenkt und AMDs Monster-Chips werden den NVIDIA-Markt aufteilen!

1. Sammeln Sie Ihre Werkzeuge

Sie benötigen eine Programmiersprache (wie Python) und eine Ner-Bibliothek (Spacy oder NLTK). Diese Werkzeuge sind wie Ihr Zauberstab und Ihr Zauberbuch.

2. Bereiten Sie Ihre Daten vor

Jeder große Zauberer braucht eine Bühne. Nicht nur in der Wissenschaft, sondern auch im Bereich der DAA-Wissenschaft ist Ihre Bühne Ihr Datensatz. Sammeln Sie Textdaten, die die Entitäten enthalten, die Sie erkennen möchten. Wenn Sie sich für Filmkritiken interessieren, sammeln Sie Texte mit Schauspielernamen, Filmtiteln usw. Denken Sie daran, Müll rein = Müll raus. Stellen Sie daher sicher, dass Ihre Daten geeignet und richtig strukturiert sind, bevor Sie fortfahren.

3. Trainieren Sie Ihr Modell

Dieser Schritt ist wie das Training eines Hundes. Zeigen Sie Ihrem Modell Beispiele von Entitäten, lassen Sie es lernen und korrigieren Sie es, wenn es falsch ist. Es ist ein bisschen so, als würde man einem Welpen das Apportieren beibringen – Wiederholung ist der Schlüssel.

4. Testen und verfeinern

Entfesseln Sie jetzt Ihr neues Modell für neue Texte. Feiern Sie, wenn es richtig läuft, und optimieren Sie, wenn es nicht klappt. Dies ist die Lernkurve Ihres Modells und es ist in Ordnung, Anpassungen vorzunehmen.

Sie können auch auf zuvor trainierten Modellen wie Bert aufbauen oder etwas komplexere Algorithmen wie bedingte Zufallsfelder verwenden und darauf aufbauen, wenn Sie einen bestimmten Anwendungsfall haben und eine höhere Genauigkeit benötigen.

Warum Komplexität annehmen?

Während die Basismodelle fantastisch sind, fügen CRF und Bert zusätzliche Ebenen der Raffinesse hinzu. crf hilft Ihrem System, den Kontext zu erfassen, und Bert bringt eine Fülle bereits vorhandener Sprachkenntnisse mit. Es ist so, als würden Sie Ihrem Nerd-System einen Doktortitel in Linguistik und die gewünschte Domain verleihen!

Lesen Sie auch Die Einbeziehung der Behandlung nichtübertragbarer Krankheiten als Reaktion auf humanitäre Notfälle wird dazu beitragen, mehr Leben zu retten

bedingte Zufallsfelder (crf)

Stellen Sie sich vor, Sie identifizieren nicht nur Entitäten, sondern berücksichtigen auch den Kontext um sie herum. Hier kommt CRF ins Spiel. Es ist, als ob Sie Ihrem Nerdsystem eine magische Brille geben würden, die es ihm ermöglicht, die Beziehungen zwischen Entitäten zu erkennen.

Wie CRF seine Magie entfaltet:

Kontext ist wichtig: crf berücksichtigt bei der Vorhersage von Entitäten die umgebenden Wörter. Dies ist für mehrdeutige Fälle von entscheidender Bedeutung. „Apfel“ könnte beispielsweise ein Unternehmen oder eine Frucht sein, aber wenn Sie den Kontext kennen (wie „Apple Inc. hat angekündigt…“), wird Ihr System intelligenter.
sequentielle Leistung: Im Gegensatz zu Basismodellen versteht CRF die sequentielle Natur der Sprache. Es eignet sich hervorragend zum Erfassen von Mustern und Abhängigkeiten, was es zu einem Meister bei Aufgaben wie Ner macht, bei denen der Kontext entscheidend ist.

Die Kraft von Bert entfesseln

Bert, oder bidirektionale Encoderdarstellungen von Transformatoren, ist wie der Dumbledore von NLP. Es handelt sich um ein vorab trainiertes Sprachmodell, das bereits eine Menge über Sprache gelernt hat, und Sie können dieses Wissen nutzen, um Ihr Nerdsystem zu optimieren.

Warum Bert ein Game-Changer ist:

Kontextuelles Verständnis: Bert betrachtet Wörter nicht nur einzeln; es versteht ihren Kontext innerhalb eines Satzes. Das heißt, es weiß, dass sich „Apfel“ in „Ich liebe meinen Apfel“ auf ein Gerät und nicht auf eine Frucht bezieht.
Out-of-the-Box-Intelligenz: Da Bert mit riesigen Datenmengen vorab trainiert ist, verfügt er bereits über ein tiefes Verständnis für Sprachnuancen. Sie können es genau auf Ihre spezifische Aufgabe abstimmen und es so zu einem leistungsstarken Verbündeten machen.

Lesen Sie auch Es wird erwartet, dass sich die Arbeitslosigkeit in Frankreich im Jahr 2024 weiter verschlimmert

Der Prozess ähnelt dem vorherigen, und es gibt Bibliotheken, die auch dabei helfen können.

Modellauswahl: