IN BREVE
Il comfort della stalla libera è legato alla libertà di movimento dei bovini. Monitorare le transizioni posturali è fondamentale per il benessere animale. Questo studio pubblicato sul Journal of Dairy Science a marzo 2024, propone un framework per rilevare i passaggi dalla posizione sdraiata a quella eretta usando telecamere e dati 3D. Un sistema di visione artificiale ha registrato i movimenti di 183 vacche in una stalla svedese tra dicembre 2021 e aprile 2022. L’accuratezza del rilevamento ha raggiunto il 99,5%, con una sensibilità dell’88,2%. Il confronto con osservatori umani ha mostrato una correlazione elevata, confermando che il modello è affidabile e privo di bias nel rilevare le transizioni posturali.

Introduzione

Il comfort delle stalle da latte varia in base alla loro dimensione e agli schemi di movimento delle bovine. La facilità con cui una vacca si alza e si sdraia è un indicatore chiave del benessere, influenzando lesioni e tempi di riposo. Studi precedenti hanno evidenziato limitazioni nei metodi di valutazione, con osservazioni visive soggettive e misurazioni cinematiche complesse. Per superare queste difficoltà, in questo studio è stato proposto un framework basato su telecamere e dati 3D per rilevare le transizioni posturali da sdraiata a eretta. L’obiettivo è confrontare l’accuratezza di questo metodo con l’osservazione umana, migliorando il monitoraggio del benessere bovino.

Materiali e metodi

Posizione e animali

Figura 1 – Schema della porzione della stalla in cui sono state ottenute le registrazioni. Le aree ombreggiate in grigio sono passaggi non accessibili alle vacche. Bordi spessi segnano i confini della stalla e le linee tratteggiate indicano un’area continua accessibile alle vacche oltre quella mostrata qui. Le telecamere sono rappresentate da cerchi rossi, posizionati tra 2,8 e 3,6 m di altezza. I rettangoli paralleli sono cubicoli; i dati sono stati raccolti in cubicoli contrassegnati con asterischi. Le frecce indicano le direzioni di movimento che le vacche sono in grado di seguire nei passaggi.

Le registrazioni video sono state effettuate presso lo Swedish Livestock Research Centre (Uppsala, Svezia) tra l’8 dicembre 2021 e il 28 aprile 2022. La mandria era composta da bovini Holstein e Red Holstein svedesi, allevati al chiuso con accesso stagionale al pascolo. Le telecamere RGB sono state posizionate strategicamente per coprire 12 cuccette, ottimizzando la visibilità delle aree di studio (Figura 1).

Acquisizione dei punti chiave in 3D

Un software di stima della posa 3D (Sony Nordic) ha analizzato le registrazioni, sincronizzando i fotogrammi e rilevando punti chiave anatomici (testa, garrese, t13, sacro) tramite reti neurali convoluzionali. L’output generato include coordinate 3D per ogni frame (Figura 2).

Figura 2 – Stima della posa 2D e fusione 3D di 2 vacche. I risultati 2D sono visualizzati in alto, mostrando i fotogrammi sincronizzati dalle telecamere da 0 a 6, su cui sono sovrapposti i bounding box previsti e i punti chiave. Il resto della scena mostra la proiezione di 2 vacche da punti chiave in 3D. Le telecamere 4 e 6 sono rappresentate rispettivamente come cuboidi magenta e grigio nella rappresentazione 3D, nella loro posizione spaziale relativa l’una all’altra e alle vacche. Una proiezione dei fotogrammi dalle telecamere 4 e 6 (identici a quelli nelle immagini 2D sopra) è mostrata di fronte alla rappresentazione 3D della telecamera. Le altre 5 rappresentazioni della telecamera non sono visualizzate da questa angolazione e la telecamera 4 nasconde la vista dalla telecamera 0 a causa della scelta dell’angolazione. Solo 4 dei punti chiave mostrati in questa figura sono stati utilizzati nello studio.

Rilevamento delle transizioni posturali

Figura 3 – Le coordinate dei punti di riferimento anatomici delle vacche da latte sono state tracciate con la stima della posa 3D. Questa figura mostra la coordinata Z (altezza) della testa, del garrese e del sacro di una vacca durante un movimento da sdraiata a eretta. Inizialmente, la bassa variabilità sull’asse verticale indica che la vacca è sdraiata immobile. A circa 11 s, il garrese (arancione) si solleva delicatamente mentre la vacca si siede sui suoi carpi, seguito da un affondo con ondeggiamento verticale della testa (blu) da 12 a 17 s. Il sacro (verde) si solleva rapidamente subito dopo, descrivendo un sigmoide. C’è una pausa sui carpi, con il sacro già sollevato, da 16 a 20 s. La vacca si è sollevata al segno dei 22 s. La linea tratteggiata verticale mostra l’inizio della transizione posturale rilevata utilizzando la segmentazione penalizzata linearmente. Questo esempio è stato selezionato per chiarezza.

Le transizioni dalla posizione sdraiata a quella in piedi (LTS) sono state individuate analizzando le variazioni delle coordinate verticali del garrese e del sacro. Sono state estratte 979 sequenze video, di cui 863 classificate come movimenti LTS attraverso un algoritmo di analisi delle coordinate (Figura 3).

Esperimento di convalida

Per validare l’efficacia del sistema, i risultati del rilevamento automatico sono stati confrontati con annotazioni di tre osservatori umani, seguendo un etogramma standardizzato. Sono state analizzate 60 sequenze LTS per valutare la precisione del metodo automatico.

Analisi statistica

L’affidabilità intra- e inter-osservatore è stata quantificata calcolando la differenza assoluta media (MAD) tra i timestamp delle annotazioni. Il metodo ha dimostrato elevata coerenza rispetto all’osservazione umana.

Risultati e discussione

Lo studio ha rilevato 836 attacchi crescenti su 979 sequenze selezionate visivamente, con una sensibilità dell’88,5% e un tasso di falsi negativi dell’11,5%. La precisione del rilevamento è stata del 99,5%, con un tasso di falsi positivi dello 0,5%.

Affidabilità e concordanza tra osservatori

Tabella 1 – Accordo tra osservatori (MAD ± σ) tra le annotazioni di tutte le coppie di osservatori, incluso il modello; le coppie tra osservatori calcolano il MAD su 30 sequenze, mentre le coppie con il modello includono 10 annotazioni aggiuntive, uniche per ciascun osservatore.

Il modello 1, che confronta gli osservatori umani, ha ottenuto un ICC di 0,85. L’ANOVA ha evidenziato un effetto osservatore significativo (P < 0,001) nella predizione dei timestamp dell’insorgenza di LTS. Il modello 2, utilizzato per valutare le prestazioni della previsione, ha registrato un ICC di 0,81, confermando un elevato livello di accordo. Il test post hoc non ha rilevato differenze significative tra il modello e le annotazioni umane, mentre ha individuato discrepanze tra gli osservatori (Tabella 1).

L’affidabilità intra-osservatore è stata valutata tramite la differenza assoluta media (MAD) e la deviazione standard (σ). Gli osservatori hanno mostrato una MAD inferiore a 1 secondo, indicando una buona coerenza nelle annotazioni.

Analisi dei dati e confronto con il modello

Figura 4 – Grafici di Bland-Altman che confrontano il timestamp dell’inizio dei movimenti di sollevamento delle vacche annotati dagli osservatori umani con quello previsto dal modello. La stima della posa 3D ha fornito le coordinate dei punti di riferimento anatomici delle vacche. Il rilevamento dei punti di interruzione nel movimento del punto chiave ha consentito il rilevamento dell’inizio del sollevamento. Diff = differenza. Tutte le unità sono in secondi.

Il confronto visivo tramite il grafico di Bland-Altman (Figura 4) mostra che i timestamp del modello non presentano bias sistematici rispetto agli osservatori. Il modello è allineato alle annotazioni umane.

Discussione

L’analisi ICC conferma un’elevata concordanza tra il modello di rilevamento automatico e gli osservatori umani. Tuttavia, le osservazioni umane sono soggette a variazioni individuali, evidenziate dall’effetto osservatore significativo rilevato tramite ANOVA. Il modello non si discosta significativamente dalle annotazioni, suggerendo che potrebbe essere utilizzato come alternativa affidabile al rilevamento manuale. Alcune limitazioni dello studio includono la sovrarappresentazione di alcuni individui e l’assenza di un rilevamento individuale. Inoltre, lo studio è stato condotto in un ambiente controllato e con selezione manuale delle sequenze, fattori che potrebbero influenzare la validità esterna del metodo.

Conclusioni

Il rilevamento automatico tramite visione artificiale 3D rappresenta un metodo oggettivo e affidabile per identificare specifici movimenti posturali nei bovini. Il sistema potrebbe essere utilizzato come nuovo gold standard per la rilevazione delle transizioni LTS, offrendo un’alternativa alla classificazione manuale e aprendo la strada a future applicazioni nel monitoraggio del comportamento animale.

Tratto da: “3-Dimensional pose estimation to detect posture transition in freestall-housed dairy cows” di Adrien Kroese, Moudud Alam, Elin Hernlund, David Berthet, Lena-Mari Tamminen,1 Nils Fall, Niclas Högberg. Journal of Dairy Science Vol. 107 No. 9, 2024. doi.org/10.3168/jds.2023-24427