Speaker-Aware Camara System (SPACS): 8 vaihetta

Sisällysluettelo:

Vaihe 1: Materiaalit
Vaihe 2: Laitteisto - 3D -tulostus
Vaihe 3: Laitteisto - elektroniset komponentit
Vaihe 4: Ohjelmisto
Vaihe 5: Ohjelmisto - Ääni
Vaihe 6: Ohjelmisto - Kasvojen ja puhumisen tunnistus
Vaihe 7: Ohjelmisto - pyörivä moottori
Vaihe 8: Tulevia parannuksia

👤 Kirjoittaja John Day 📧 [email protected].
⏱ Public 2024-01-30 09:01.
🖍 Viimeksi muokattu 2025-01-23 14:42.

Kuvittele neuvottelupuhelu, jossa useita kaiuttimia ympäröi yhtä kameraa. Kohtaamme usein tilanteita, joissa kameran rajallinen katselukulma ei useinkaan pysty katsomaan puhuvaa henkilöä. Tämä laitteiston rajoitus heikentää käyttökokemusta merkittävästi. Jos kamera voi katsoa aktiivisia kaiuttimia, etäyleisö osallistuu enemmän keskusteluun puhelun aikana. Tässä projektissa ehdotamme (prototyyppistä) kamerajärjestelmää, joka tunnistaa ja seuraa aktiivista kaiutinta kääntämällä kameraa kaiutinta kohti. Järjestelmä käyttää sekä visuaalista että äänipohjaista lähestymistapaa. Kun kasvot tunnistetaan kamerasta, se määrittää puhujan ja laskee pyörimiskulman. Jos kasvoja ei tunnisteta kulmassa, järjestelmä etsii kaiutinta saapuvien äänisignaalien suunnan perusteella.

Vaihe 1: Materiaalit

Adafruit Feather nRF52840 Express X 1

www.adafruit.com/product/4062

Elektret -mikrofonivahvistin - MAX4466 X 2

www.adafruit.com/product/1063

Mikroservomoottori X 1

www.adafruit.com/product/169

Android -älypuhelin X 1

Vaihe 2: Laitteisto - 3D -tulostus

Nopean käyttöönoton vuoksi päätimme tulostaa tarvitsemamme kotelot 3D-painatuksella. Koteloille on kaksi pääkomponenttia; kääntöpöytä ja älypuhelinteline. Käytimme levysoitinta tästä linkistä (https://www.thingiverse.com/thing:141287), jossa sen alaosassa on Arduino -kotelo ja pyörivä pöytä, joka voidaan liittää servomoottoriin. Käytimme tästä linkistä (https://www.thingiverse.com/thing:2673050) peräisin olevaa älypuhelintelineä, joka on taitettava ja kulmaa säädettävä, jotta voimme kalibroida kulman kätevästi. Alla oleva kuva esittää 3D -painetut osat koottuna yhteen.

Vaihe 3: Laitteisto - elektroniset komponentit

Langallisia osia on neljä; Adafruit Feather, kaksi mikrofonia ja moottori. Kompaktissa pakkauksessa juotimme (harmaat ympyrät) johdot ilman leipälevyä. Alla kuvataan piirikaavio ja varsinainen esine.

Vaihe 4: Ohjelmisto

Järjestelmämme käyttää ensisijaisesti kasvojentunnistuksen visuaalista tietoa seuratakseen kaiutinta, koska se on tarkempaa. Jotta Feather saisi visuaalista tietoa Android -sovelluksesta, käytämme Bluetooth Low Energy -järjestelmää pääasiallisena viestintämenetelmänä.

Kun kasvot havaitaan, sovellus laskee kulman, jonka moottorin on pyöritettävä, jotta kaiutin voidaan tarkentaa kehyksen keskelle. Purimme mahdolliset skenaariot ja toimimme seuraavasti:

Jos kasvot tunnistetaan ja he puhuvat, se laskee kaiuttimien keskipisteen ja palauttaa höyhenen suhteellisen kulman.
Jos kasvot tunnistetaan, mutta kukaan niistä ei puhu, se laskee myös kasvojen keskipisteen ja palauttaa kulman vastaavasti.
Jos kasvoja ei tunnisteta, järjestelmä muuttaa kaiuttimien seuraamislogiikan visuaalisesta audioksi.

SPACS-ohjelmisto sijaitsee osoitteessa

Vaihe 5: Ohjelmisto - Ääni

Ääni (YH)

Saapuvan äänen lähteen paikantamiseksi yritimme ensin käyttää kahden mikrofonin aikaeroa. Mutta se ei ollut niin tarkka kuin odotimme, koska Arduino Leopardin näytteenottotaajuus (~ 900 Hz), jossa testasimme äänisignaaleja, olivat hitaita, joten se ei voi poimia 10 cm: n etäisyydellä olevien mikrofonien aikaeroa.

Muutimme suunnitelmaa käyttää kahden tulosignaalin voimakkuuseroa. Tämän seurauksena sulka ottaa kaksi äänisignaalia ja käsittelee ne havaitsemaan, mistä ääni tuli. Käsittely voidaan kuvata seuraavilla vaiheilla:

Ota tulot kahdesta mikrofonista ja vähennä siirtymä saadaksesi signaalien amplitudit.
Kerää amplitudien absoluuttiset arvot MIC: tä kohti 500 noutoa varten.
Tallenna kertyneiden arvojen ero jonoon, jossa on 5 paikkaa.
Palauta jonojen summa lopullisena eroarvona.
Vertaa lopullista arvoa kynnyksiin päättääksesi, mistä ääni tulee.

Löysimme kynnyksen piirtämällä lopullisen arvon eri olosuhteissa, mukaan lukien ääni vasemmalta ja oikealta. Lopullisen arvon kynnysten lisäksi asetimme myös toisen kynnyksen kertyneiden amplitudien keskiarvolle vaiheessa 2 melun suodattamiseksi.

Vaihe 6: Ohjelmisto - Kasvojen ja puhumisen tunnistus

Kasvontunnistuksessa käytimme Googlen julkaisemaa ML Kit for Firebasea (https://firebase.google.com/docs/ml-kit). ML Kit tarjoaa kasvojentunnistusliittymän, joka palauttaa jokaisen kasvon ja sen maamerkkien, mukaan lukien silmät, nenä, korvat, posket ja suun eri kohdat, rajauslaatikon. Kun kasvot on havaittu, sovellus seuraa suun liikkeitä määrittääkseen, puhuuko henkilö. Käytämme yksinkertaista kynnyspohjaista lähestymistapaa, joka tuottaa luotettavaa suorituskykyä. Hyödynnämme sitä tosiasiaa, että suun liike kasvaa sekä vaakasuoraan että pystysuoraan, kun henkilö puhuu. Laskemme suun pystysuoran ja vaakasuoran etäisyyden ja laskemme keskihajonnan kullekin etäisyydelle. Etäisyys normalisoidaan kasvojen koon mukaan. Suurempi keskihajonta osoittaa puhumista. Tällä lähestymistavalla on se rajoitus, että jokainen toiminta sisältää suun liikkeitä, mukaan lukien syöminen, juominen tai haukottelu, voidaan tunnistaa puhuviksi. Mutta sillä on alhainen vääriä negatiivisia prosentteja.

Vaihe 7: Ohjelmisto - pyörivä moottori

Moottorin pyöriminen ei ollut niin suoraviivaista kuin odotimme pyörimisnopeuden säätämisen vuoksi. Nopeuden hallitsemiseksi ilmoitamme globaalin laskurin muuttujan, joka sallii moottorin kääntyä vasta, kun muuttuja saavuttaa tietyn arvon. Ilmoitimme myös toisen globaalin muuttujan, joka osoittaa, liikkuuko moottori, jotta mikrofonit saisivat tietää, jotta se voi välttää moottorin pyörimisestä tulevan äänen.

Vaihe 8: Tulevia parannuksia

Yksi rajoituksista on, että moottori heiluu tietyissä kulmissa. Näyttää siltä, että moottori ei ole tarpeeksi tehokas voittamaan älypuhelimen pyörittämisen aiheuttamaa vääntömomenttia. Se voidaan ratkaista käyttämällä tehokkaampaa moottoria tai säätämällä älypuhelimen asentoa pyörimiskeskusta kohti vääntömomentin pienentämiseksi.

Äänipohjaista äänen suunnan tunnistusta voitaisiin parantaa kehittyneemmällä menetelmällä. Haluaisimme kokeilla akustista säteenmuodostusmenetelmää tulevan äänen suunnan määrittämiseksi. Olemme yrittäneet audiosignaalien saapumisajan kanssa. Höyhenen näytteenottotaajuus on kuitenkin rajoitettu havaitsemaan aikaero, kun mikrofonit ovat vain noin 10 cm: n päässä.

Tämän prototyypin viimeinen puuttuva osa on käytettävyyden arviointi. Yksi lupaava tapa arvioida on integroida järjestelmä olemassa olevaan videopuhelualustaan ja tarkkailla käyttäjien vastauksia. Nämä vastaukset auttavat parantamaan järjestelmää ja tekemään tämän prototyypin seuraavan iteraation.

Suositeltava:

Mood Speaker- tehokas kaiutin mielialan musiikin toistamiseen ympäristön lämpötilan perusteella: 9 vaihetta

Mood Speaker- tehokas kaiutin mielialan musiikin toistamiseen ympäristön lämpötilan perusteella: Hei! MCT Howest Kortrijk -kouluprojektissani tein Mood Speakerin, joka on älykäs Bluetooth-kaiutinlaite, jossa on eri anturit, LCD ja WS2812b Kaiutin toistaa taustamusiikkia lämpötilan mukaan, mutta voi

Proyecto Museo De Herling ja Paula De La Cámara: 4 vaihetta

Proyecto Museo De Herling ja Paula De La Cámara: En este proyecto vamos a relizar un museo, en el cual vamos ha programar varias alarmas para que salte cuando aimen robar la joya, tambien vamos a utilizar sensores de luz para que dectecten los distintos movimiento del que intento robar la joya

Prototipo Deslizador Para Cámara Professional DSLR: 6 vaihetta

Prototipo Deslizador Para Cámara Profesional DSLR: El proyecto consiste en hacer un deslizador de cámara motorizado con cabezal de giro and inclinación. El proyecto es basado en arduino, PLA y Aluminio, 3 moottoria ja pasoja, botunit ja joystick sekä PCB -sairaudet ja -välineet. El uudelleen

Reutilizar Vieja Cámara Digital: 7 vaihetta

Reutilizar Vieja Cámara Digital: El prop ó sito de este instructable es: modificar una vieja c á mara que no utilizas.A ñ adir un bot ó no pulsador extra, con el que m á adelante podr á instrukator que har é .Tambi & ea

Camara De Video En Carro De Radio Control / Videokamera R / C -kuorma -autossa: 5 vaihetta

Camara De Video En Carro De Radio Control / Video Camera on R / C Truck: Este Instruccionable presentado en Espanol e Ingles

Speaker-Aware Camara System (SPACS): 8 vaihetta

Sisällysluettelo:

Vaihe 1: Materiaalit

Vaihe 2: Laitteisto - 3D -tulostus

Vaihe 3: Laitteisto - elektroniset komponentit

Vaihe 4: Ohjelmisto

Vaihe 5: Ohjelmisto - Ääni

Vaihe 6: Ohjelmisto - Kasvojen ja puhumisen tunnistus

Vaihe 7: Ohjelmisto - pyörivä moottori

Vaihe 8: Tulevia parannuksia

Suositeltava:

Mood Speaker- tehokas kaiutin mielialan musiikin toistamiseen ympäristön lämpötilan perusteella: 9 vaihetta

Proyecto Museo De Herling ja Paula De La Cámara: 4 vaihetta

Prototipo Deslizador Para Cámara Professional DSLR: 6 vaihetta

Reutilizar Vieja Cámara Digital: 7 vaihetta

Camara De Video En Carro De Radio Control / Videokamera R / C -kuorma -autossa: 5 vaihetta

Valosolun käyttäminen RGB -LEDin värin muuttamiseen: 3 vaihetta

Sosiaalisen etäisyyden tunnistimen tekeminen: 15 vaihetta

Sadetunnistin Arduinon ja sadepisaran tunnistimen avulla: 8 vaihetta

Mini Cardboard -valomiekka: 7 vaihetta

Arduino Sound Monitor: 5 vaihetta

Kolmas silmä (Arduino -projekti): 3 vaihetta

Hexabitz, hämmästyttävä uusi tapa rakentaa prototyyppi: 6 vaihetta

Ohjelmoitavat FireBlinks RGB LED -kengät: 6 vaihetta

Aurinkopaneelin USB -laturi: 9 vaihetta

Kuinka tallentaa IOS 12 -näyttö Facecamilla?: 4 vaihetta

Polargraph Drawbot: 6 vaihetta

Duck Tape -puhelinkotelo rahapussilla: 3 vaihetta (kuvilla)

Halvat Arduino Combat Robot Control: 10 vaihetta (kuvilla)

Elektroniset projektit aloittelijoille: 14 vaihetta (kuvilla)

Makey Makey Circuit Breadboardilla: 11 vaihetta (kuvilla)

Automaattinen lumen herätys: 6 vaihetta (kuvilla)