Sisällysluettelo:
2025 Kirjoittaja: John Day | [email protected]. Viimeksi muokattu: 2025-01-23 14:42
Kuvittele neuvottelupuhelu, jossa useita kaiuttimia ympäröi yhtä kameraa. Kohtaamme usein tilanteita, joissa kameran rajallinen katselukulma ei useinkaan pysty katsomaan puhuvaa henkilöä. Tämä laitteiston rajoitus heikentää käyttökokemusta merkittävästi. Jos kamera voi katsoa aktiivisia kaiuttimia, etäyleisö osallistuu enemmän keskusteluun puhelun aikana. Tässä projektissa ehdotamme (prototyyppistä) kamerajärjestelmää, joka tunnistaa ja seuraa aktiivista kaiutinta kääntämällä kameraa kaiutinta kohti. Järjestelmä käyttää sekä visuaalista että äänipohjaista lähestymistapaa. Kun kasvot tunnistetaan kamerasta, se määrittää puhujan ja laskee pyörimiskulman. Jos kasvoja ei tunnisteta kulmassa, järjestelmä etsii kaiutinta saapuvien äänisignaalien suunnan perusteella.
Vaihe 1: Materiaalit
Adafruit Feather nRF52840 Express X 1
www.adafruit.com/product/4062
Elektret -mikrofonivahvistin - MAX4466 X 2
www.adafruit.com/product/1063
Mikroservomoottori X 1
www.adafruit.com/product/169
Android -älypuhelin X 1
Vaihe 2: Laitteisto - 3D -tulostus
Nopean käyttöönoton vuoksi päätimme tulostaa tarvitsemamme kotelot 3D-painatuksella. Koteloille on kaksi pääkomponenttia; kääntöpöytä ja älypuhelinteline. Käytimme levysoitinta tästä linkistä (https://www.thingiverse.com/thing:141287), jossa sen alaosassa on Arduino -kotelo ja pyörivä pöytä, joka voidaan liittää servomoottoriin. Käytimme tästä linkistä (https://www.thingiverse.com/thing:2673050) peräisin olevaa älypuhelintelineä, joka on taitettava ja kulmaa säädettävä, jotta voimme kalibroida kulman kätevästi. Alla oleva kuva esittää 3D -painetut osat koottuna yhteen.
Vaihe 3: Laitteisto - elektroniset komponentit
Langallisia osia on neljä; Adafruit Feather, kaksi mikrofonia ja moottori. Kompaktissa pakkauksessa juotimme (harmaat ympyrät) johdot ilman leipälevyä. Alla kuvataan piirikaavio ja varsinainen esine.
Vaihe 4: Ohjelmisto
Järjestelmämme käyttää ensisijaisesti kasvojentunnistuksen visuaalista tietoa seuratakseen kaiutinta, koska se on tarkempaa. Jotta Feather saisi visuaalista tietoa Android -sovelluksesta, käytämme Bluetooth Low Energy -järjestelmää pääasiallisena viestintämenetelmänä.
Kun kasvot havaitaan, sovellus laskee kulman, jonka moottorin on pyöritettävä, jotta kaiutin voidaan tarkentaa kehyksen keskelle. Purimme mahdolliset skenaariot ja toimimme seuraavasti:
- Jos kasvot tunnistetaan ja he puhuvat, se laskee kaiuttimien keskipisteen ja palauttaa höyhenen suhteellisen kulman.
- Jos kasvot tunnistetaan, mutta kukaan niistä ei puhu, se laskee myös kasvojen keskipisteen ja palauttaa kulman vastaavasti.
- Jos kasvoja ei tunnisteta, järjestelmä muuttaa kaiuttimien seuraamislogiikan visuaalisesta audioksi.
SPACS-ohjelmisto sijaitsee osoitteessa
Vaihe 5: Ohjelmisto - Ääni
Ääni (YH)
Saapuvan äänen lähteen paikantamiseksi yritimme ensin käyttää kahden mikrofonin aikaeroa. Mutta se ei ollut niin tarkka kuin odotimme, koska Arduino Leopardin näytteenottotaajuus (~ 900 Hz), jossa testasimme äänisignaaleja, olivat hitaita, joten se ei voi poimia 10 cm: n etäisyydellä olevien mikrofonien aikaeroa.
Muutimme suunnitelmaa käyttää kahden tulosignaalin voimakkuuseroa. Tämän seurauksena sulka ottaa kaksi äänisignaalia ja käsittelee ne havaitsemaan, mistä ääni tuli. Käsittely voidaan kuvata seuraavilla vaiheilla:
- Ota tulot kahdesta mikrofonista ja vähennä siirtymä saadaksesi signaalien amplitudit.
- Kerää amplitudien absoluuttiset arvot MIC: tä kohti 500 noutoa varten.
- Tallenna kertyneiden arvojen ero jonoon, jossa on 5 paikkaa.
- Palauta jonojen summa lopullisena eroarvona.
- Vertaa lopullista arvoa kynnyksiin päättääksesi, mistä ääni tulee.
Löysimme kynnyksen piirtämällä lopullisen arvon eri olosuhteissa, mukaan lukien ääni vasemmalta ja oikealta. Lopullisen arvon kynnysten lisäksi asetimme myös toisen kynnyksen kertyneiden amplitudien keskiarvolle vaiheessa 2 melun suodattamiseksi.
Vaihe 6: Ohjelmisto - Kasvojen ja puhumisen tunnistus
Kasvontunnistuksessa käytimme Googlen julkaisemaa ML Kit for Firebasea (https://firebase.google.com/docs/ml-kit). ML Kit tarjoaa kasvojentunnistusliittymän, joka palauttaa jokaisen kasvon ja sen maamerkkien, mukaan lukien silmät, nenä, korvat, posket ja suun eri kohdat, rajauslaatikon. Kun kasvot on havaittu, sovellus seuraa suun liikkeitä määrittääkseen, puhuuko henkilö. Käytämme yksinkertaista kynnyspohjaista lähestymistapaa, joka tuottaa luotettavaa suorituskykyä. Hyödynnämme sitä tosiasiaa, että suun liike kasvaa sekä vaakasuoraan että pystysuoraan, kun henkilö puhuu. Laskemme suun pystysuoran ja vaakasuoran etäisyyden ja laskemme keskihajonnan kullekin etäisyydelle. Etäisyys normalisoidaan kasvojen koon mukaan. Suurempi keskihajonta osoittaa puhumista. Tällä lähestymistavalla on se rajoitus, että jokainen toiminta sisältää suun liikkeitä, mukaan lukien syöminen, juominen tai haukottelu, voidaan tunnistaa puhuviksi. Mutta sillä on alhainen vääriä negatiivisia prosentteja.
Vaihe 7: Ohjelmisto - pyörivä moottori
Moottorin pyöriminen ei ollut niin suoraviivaista kuin odotimme pyörimisnopeuden säätämisen vuoksi. Nopeuden hallitsemiseksi ilmoitamme globaalin laskurin muuttujan, joka sallii moottorin kääntyä vasta, kun muuttuja saavuttaa tietyn arvon. Ilmoitimme myös toisen globaalin muuttujan, joka osoittaa, liikkuuko moottori, jotta mikrofonit saisivat tietää, jotta se voi välttää moottorin pyörimisestä tulevan äänen.
Vaihe 8: Tulevia parannuksia
Yksi rajoituksista on, että moottori heiluu tietyissä kulmissa. Näyttää siltä, että moottori ei ole tarpeeksi tehokas voittamaan älypuhelimen pyörittämisen aiheuttamaa vääntömomenttia. Se voidaan ratkaista käyttämällä tehokkaampaa moottoria tai säätämällä älypuhelimen asentoa pyörimiskeskusta kohti vääntömomentin pienentämiseksi.
Äänipohjaista äänen suunnan tunnistusta voitaisiin parantaa kehittyneemmällä menetelmällä. Haluaisimme kokeilla akustista säteenmuodostusmenetelmää tulevan äänen suunnan määrittämiseksi. Olemme yrittäneet audiosignaalien saapumisajan kanssa. Höyhenen näytteenottotaajuus on kuitenkin rajoitettu havaitsemaan aikaero, kun mikrofonit ovat vain noin 10 cm: n päässä.
Tämän prototyypin viimeinen puuttuva osa on käytettävyyden arviointi. Yksi lupaava tapa arvioida on integroida järjestelmä olemassa olevaan videopuhelualustaan ja tarkkailla käyttäjien vastauksia. Nämä vastaukset auttavat parantamaan järjestelmää ja tekemään tämän prototyypin seuraavan iteraation.
Suositeltava:
Mood Speaker- tehokas kaiutin mielialan musiikin toistamiseen ympäristön lämpötilan perusteella: 9 vaihetta
Mood Speaker- tehokas kaiutin mielialan musiikin toistamiseen ympäristön lämpötilan perusteella: Hei! MCT Howest Kortrijk -kouluprojektissani tein Mood Speakerin, joka on älykäs Bluetooth-kaiutinlaite, jossa on eri anturit, LCD ja WS2812b Kaiutin toistaa taustamusiikkia lämpötilan mukaan, mutta voi
Proyecto Museo De Herling ja Paula De La Cámara: 4 vaihetta
Proyecto Museo De Herling ja Paula De La Cámara: En este proyecto vamos a relizar un museo, en el cual vamos ha programar varias alarmas para que salte cuando aimen robar la joya, tambien vamos a utilizar sensores de luz para que dectecten los distintos movimiento del que intento robar la joya
Prototipo Deslizador Para Cámara Professional DSLR: 6 vaihetta
Prototipo Deslizador Para Cámara Profesional DSLR: El proyecto consiste en hacer un deslizador de cámara motorizado con cabezal de giro and inclinación. El proyecto es basado en arduino, PLA y Aluminio, 3 moottoria ja pasoja, botunit ja joystick sekä PCB -sairaudet ja -välineet. El uudelleen
Reutilizar Vieja Cámara Digital: 7 vaihetta
Reutilizar Vieja Cámara Digital: El prop ó sito de este instructable es: modificar una vieja c á mara que no utilizas.A ñ adir un bot ó no pulsador extra, con el que m á adelante podr á instrukator que har é .Tambi & ea
Camara De Video En Carro De Radio Control / Videokamera R / C -kuorma -autossa: 5 vaihetta
Camara De Video En Carro De Radio Control / Video Camera on R / C Truck: Este Instruccionable presentado en Espanol e Ingles