Ich sagte ja, jetzt kommt die Arbeit ....
![]() |
| von KI erstellt |
Ich habe aus dem Tierstimmenarchiv einige Fledermausrufe herunter geladen und wollte wissen, ob mein TeensyBat in Verbindungen mit der Analyse-Software BatDetect2 gut oder schlecht zusammen arbeitet.
Im Tierstimmenarchiv sind die Rufe einer Art wunderbar nach verschiedenen Aufnahme-Situationen gelistet - "echolocation call", "call", "feeding buzz" und "social call".
echolocation call = Echo-Ortungsruf (wo bin ich überhaupt)
call = ein einfacher Ruf (keine genau Erklärung gefunden)
feeding buzz = Beute-Ortung (Beute wird geortet und gefangen / gefressen)
social call = Soziale Rufe (ich bin hier, wo bist du?)
Ich habe bei meinen selbstgemachten Aufnahmen festgestellt, dass wenn ich den Threshold (Schwellenwert) bei BatDetect2 verändere, ich plötzlich eine andere Gewichtung bei der Auswertung bekam. Es wurden immer noch die gleichen Arten vermutet, aber eine andere Konfidenz (Wahrscheinlichkeit, ob es eine Art ist).
😑
Woran liegt das und was bedeutet das für weitere Aufnahmen / Auswertungen ?
Es liegt NICHT am Aufnahmegerät, die Aufnahmen sind immer gleich.
Wenn ich jetzt die spärlichen Informationen zu der Software anschaue, finde ich nur, dass der Threshold (Schwellenwert) von 0.1 bis 0.9 liegen kann.
Eigentlich heißt der Threshold richtig "Detection Threshold" und bedeutet auf deutsch "Erkennungschwellenwert". Der liegt im Bereich von 0.1 bis 0.9.
BatDetect2 ist ein künstliches neuronales Netz und prüft jeden im Ultraschallbereich erkannten Laut und weist ihm eine "Confidence" (Zuversicht) zu.
| Threshold-Wert | Bedeutung für die Detektion | Beispiel |
| 0.9 (Hoch) | Der Laut muss zu mindestens 90% als Fledermausruf wahrscheinlich sein. | Nur laute, klare Rufe (wie Suchrufe im Freifeld) werden erfasst. Maximale Präzision, minimale Fehlalarme. |
| 0.5 (Mittel) | Der Laut muss zu mindestens 50% als Fledermausruf wahrscheinlich sein. | Ein guter Kompromiss. Erfasst die meisten Rufe, aber auch kurze Feeding Buzzes und einige Social Calls. |
| 0.3 (Niedrig, oft Standard) | Der Laut muss zu mindestens 30% als Fledermausruf wahrscheinlich sein. | Maximale Vollständigkeit (Recall). Erfasst nahezu alle Rufe, einschließlich leiser Social Calls und entferntem Material, nimmt aber viele Fehlalarme (Rauschen, Artefakte) in Kauf. |
Die Wahl des Thresholds ist immer ein technisch-wissenschaftlicher Kompromiss zwischen zwei Zielen:
- Hohe Präzision (Accuracy): Du möchtest sicher sein, dass alle erfassten Detektionen auch wirklich Fledermäuse sind. Wähle einen HOHEN Threshold (0.7 – 0.9).
- Hohe Vollständigkeit (Recall): Du möchtest sicherstellen, dass du keinen einzigen Fledermausruf verpasst, insbesondere leises oder komplexes Verhalten. Wähle einen NIEDRIGEN Threshold (0.3 – 0.5).
Dann kommt der Ort der Aufnahme mit ins Spiel.
Bin ich im Bereich möglicher Wochenstuben, sollte der Threshold NIEDRIG gehalten werden. Dort ist die Wahrscheinlichkeit für "social calls" nun mal wesentlich höher als zum Beispiel in einem Jagdgebiet wie See oder Waldrand.
Im Umkehrspiel - in einem Jagdgebiet sollte der Threshold HOCH gehalten werden, um jeden Ruf zu erfassen.
Hier ein Screenshot eines Python-Scriptes .....
Die linke Spalte beinhalten den Threshold-Wert 0.1 bei einer Chunk-Size von 2 Sekunden bzw. 5 Sekunden.
Fazit: Die ortsabhängige Analyse-Strategie
Eine ergebnisorientierte Analyse der Fledermausrufe mit BatDetect2 muss den Aufnahmeort und das damit verbundene erwartete Verhalten berücksichtigen.
Das Hauptproblem ist, dass die Amplitude (Lautstärke) der Rufe, die die KI zur Confidence und damit zum Threshold führt, stark variiert:
| Habitattyp | Erwartetes Verhalten & Ruftyp | Akustische Anforderung an die Software |
| Quartier-Nähe / Wochenstuben | Kommunikation (Sozialrufe). Diese Rufe sind oft niederfrequenter und besitzen eine geringere Amplitude (leiser). | Die Software muss auf eine hohe Sensitivität kalibriert werden. Dies erfordert einen niedrigen Detection Threshold (DT) (z.B. 0.3 – 0.5) zur Erfassung der leisen Rufe. |
| Jagdgebiete (Freifeld, Gewässer) | Echoortung (Suchrufe, Fressflüge). Die Rufe sind hochenergetisch (laut) und auf maximale Reichweite optimiert. | Die Software kann auf eine hohe Präzision eingestellt werden, um das Signal-Rausch-Verhältnis zu optimieren. Dies erfordert einen hohen Detection Threshold (DT) (z.B. 0.7 – 0.9). |
Die Anpassung des Detection Thresholds an die spezifische akustische Umgebung ist daher unerlässlich, um sicherzustellen, dass die Software entweder für laute, distanzoptimierte Jagdrufe oder für leise, komplexe Sozialrufe optimal parametriert ist und somit valide wissenschaftliche Ergebnisse liefert.
Ich habe insgesamt über 15.000 Rufe von Fledermäusen analysieren lassen, immer wieder verschiedene Einstellungen bei BatDetect2 gemacht, um auf das Ergebnis zu kommen.
Mit anderen Worten - das Fahrrad fährt schlecht mit platten Reifen, das Ruderboot ist ohne Wasser auch nur eine Sitzbank.
Soll heißen, nur wenn ich die Software richtig einsetze, bekomme ich auch gute Ergebnisse.
Anmerkung:
Einige Texte wurden mit Hilfe einer KI umformuliert, die Tabellen mit KI erstellt - es gibt keine Tabellen-Funktion bei Blogger. Das Python-Script wurde durch eine KI erstellt.


Keine Kommentare:
Kommentar veröffentlichen