• heijenoort@feddit.it
    link
    fedilink
    arrow-up
    3
    ·
    1 year ago

    Nì. Avere un aggeggio che resta perennemente in ascolto, registra, estrae parole chiave, analizza, ecc. sarebbe mostruosamente costoso (in tutti i sensi) oltre che inefficiente. Quello che succede negli smartphone, in parole povere, è che esiste un modulo a bassissimo consumo altamente specializzato che fa solo una cosa: ascolta se viene detta la parola magica e basta: non appena la parola è riconosciuta allora viene attivato l’assistente vero e proprio (e questo sì, prende la voce, la manda sui server dove viene analizzata ecc. ecc.)

    • Rinox@feddit.it
      link
      fedilink
      arrow-up
      3
      ·
      1 year ago

      Si, ma chi ti dice che questo modulo sia all’ascolto esclusivamente della parola magica, e non anche di un altro set di parole predefinite? Ad esempio se non ricordo male l’assistente usa già due parole magiche, sia “ok Google” che “hey Google”. Basterebbe un piccolo dizionario di parole che quando vengono dette, vengono salvate da qualche parte e poi ogni tanto mandate a Google per aumentare la precisione degli annunci.

      Poi ripeto, con ogni probabilità non succede, ma tecnicamente non mi pare impossibile.

    • Novman@feddit.it
      link
      fedilink
      arrow-up
      2
      ·
      edit-2
      1 year ago

      Tecnicamente con un processore dedicato non è così difficile. Il microfono è sempre accesso, automaticamente fai speechtotext, che è quello che fa per riconoscere la parola chiave, poi, se quello che dici rientra in un dizionario limitato, invia il tutto in maniera asincrona quando la rete è disponibile ( il testo occupa pochissima banda ) . Del resto si è scoperto che Alexa mandava registrazioni in giro. Si è scoperto che pure certi chip mandano dati in giro ( tramite analisi del traffico ) dati anche senza android presente. I dati che vengono spediti sono sempre crittati. Tecnicamente non è impossibile.

      Edit: se si fa speechtotext di tutto il parlato che viene intercettato dal microfono si ottengono al max pochi kb al giorno, praticamente si possono accodare a qualsiasi processo e manco ce ne si accorge.

      Edit2: i chip esistono dal 2017

      https://news.mit.edu/2017/low-power-chip-speech-recognition-electronics-0213