Selecciona Edició
Connecta’t

Llibre amb veu humana (o no)

La lectura de textos des dels assistents personals obre noves vies, però també més d’alguna inquietud, al sector editorial

Estudi de gravació de Storytel, amb un senyal de veu.
Estudi de gravació de Storytel, amb un senyal de veu.

Potser és vostè dels que tria llibres sense dir res, de la mà de les atzaroses afinitats electives que porta remenar per una llibreria i esperar que un títol el condueixi a un altre. O potser és dels que prefereix preguntar al llibreter de capçalera quina pot ser la lectura següent a partir de la darrera que ha devorat. Més aviat del que es pensa, aquesta pregunta la hi farà a un assistent de veu que, a més, li llegirà aquell títol, que ja estarà en format electrònic o en audiollibre, o potser li reproduirà un podcast. Llei de l’accelerada vida moderna i del present perpetu que ens ocupa: WhatsApp està mutant de la comunicació textual a la missatgeria de veu i els fabricants d’ordinadors ja fixen entre cinc i deu anys el que es trigarà que desapareguin els teclats dels ordinadors...

L’any vinent, la meitat de les cerques que es realitzaran a la xarxa es farà a través de la veu, segons l’empresa de mesurament Comscore. Tots els senyals de la tendència hi són: només l’any passat, es van vendre als EUA més de 133 milions de dispositius de veu; del gener del 2018 al gener d’enguany, l’increment ha estat del 39,8%. O sigui, 66 milions de nord-americans adults, dels 253 milions del país, ja en tenen un. I els llibres, curiosament, no són lluny d’aquest món: es calcula que un 43% de les consultes que es fan als programes d’assistents de veu són de contingut cultural, entenent com a tal llibres, música i premsa.

Els assistents personals per veu s'incorporen a la vida quotidiana. ampliar foto
Els assistents personals per veu s'incorporen a la vida quotidiana.

Específicament, al país far en aquestes tendències hi ha 3,5 milions de consultes referides directament o indirecta a llibres... cada dia. O sigui, és un producte demanat. Això no sembla un problema. Sí que amenaça de ser-ho trobar un llibre en concret: de totes les consultes, una mica més de la meitat, 1,9 milions de cerques, no van ser enteses i van fracassar (les respostes, o van ser incorrectes o clarament incompletes). El rànquing de qui més va fallar va ser Siri d’Apple, amb només un 15% d’encerts; Bixby de Samsung tampoc va estar gaire fi (23,2%); Alexa, la famosa veu d’Amazon, es quedà al mig (44,2%); Cortana, de Microsoft, superà clarament la meitat de les preguntes (60,8%), i qui més bé ho va resoldre va ser, de llarg, Assistant de Google (72,5%).

El que és de debò inquietant per al sector és la traducció en diners d’aquestes llacunes. “El 2% de les consultes tenien intenció de compra real, cosa que vol dir que el sector editorial té aquí unes 70.000 comandes de llibres diàries; extrapolant, enguany es calcula que els editors dels EUA perdran potencialment uns 15 milions d’euros, i el 2020 arribarien als 44 milions”, apunta Javier Celaya, soci fundador i director de Dosdoce.com, experts en l’anàlisi de la cruïlla del sector editorial amb les noves tecnologies. La clau està en les famoses metadades, que han de donar les coordenades del volum: “Si no estan ben fetes i no se’n posen tantes com sigui possible, aquell títol no queda indexat correctament i els algoritmes no el troben, el llibre no surt; aquí el sector haurà d’invertir”. No és l’únic desafiament a què s’hauran d’enfrontar els editors; hi ha interrogants tan apassionants com inquietants: “Si la relació, la cerca, és només oral, ¿això posarà fi al poder que té avui la coberta, que té tant de pes en la decisió de compra quan vas a descobrir títols? Les editorials es posaran a comprar aquest nou espai mediàtic?”, llança. En el pack de problemes potencials, un de més seriós: que aquest nou format, per característiques tecnològiques, acabi fent créixer encara més el procés de concentració.

Els vents, però, sembla que bufen de cara, ara per ara, per a l’opció dels llibres escoltats. Els senyals se senten d’arreu: a mitjan any passat, l’empresa Good-E-Reader ultimava una app per a mòbils que converteix qualsevol llibre digital en audiollibre; la filial del grup francès Hachette als EUA ja crea històries específiques per ser llegides pels assistents de veu després d’un acord amb Amazon; el 52% dels espanyols menors de 45 anys escolten podcasts, i un 60% dels joves de 18 a 24 anys n’han sentit un en els darrers tres dies. Els audiollibres són clau: són el segment de l’edició digital que més creix als EUA, on el 2018 es van produir gairebé 50.000 títols. El catàleg, utilitzat en un 54% per gent que té menys de 45 anys, està a punt d’arribar als 375.000 títols. Els xinesos es van gastar prop de 415 milions d’euros en el format i a Europa ha generat 442 milions d’euros de guanys.

En una relació oral, de què servirà la coberta? Es podrà comprar aquest nou espai mediàtic?

A Espanya les coses funcionen més modestament, però en el mateix sentit. Celaya xifra en uns cinc milions d’euros les vendes d’audiollibres a Espanya i l’Amèrica Llatina durant el 2018, i calcula que els títols que hi haurà al mercat en aquest format arribaran als 10.000 aquest mateix 2019. Però li agrada destacar un nombre amb rerefons sociològic: l’any passat, per primer cop, el gran canal de venda d’ebooks i audiollibres no va ser la venda unitària ni l’streaming (tercera opció), sinó les plataformes de subscripció: l’ús, més que no la propietat, també sembla que arriba al llibre, com ja passa al món dels cotxes o de les sèries de televisió. El 18% dels ingressos digitals de les editorials provenen de les vendes derivades de la subscripció.

El mal d’orella és el cost de passar un llibre a audiobook: calen uns 3.000 euros de mitjana per una novel·la d’unes 200 planes. No cal dir que el sector està expectant amb l’evolució de les veus sintètiques. “Abaixaria moltíssim els costos i això permetria invertir en un nombre més alt de títols als catàlegs”, tradueix Celaya. Però, tot i els avenços espectaculars, admet, els resultats són irregulars. “De moment, no imiten gaire bé la veu humana, no hi ha empatia, no transmeten prou matisos de sentiment; és un to que aguantes 20 minuts: serveixen per a textos informatius, educatius o assaigs, però encara no per llegir poesia o novel·la, que requereixen una cosa més sentida”.

Des de l’estiu passat, Google, com totes les grans firmes tecnològiques, treballa per modelar la prosòdia i els diferents factors expressius de les màquines: entonacions, ritmes... Qüestió de temps. De moment, però, pronostica que “en un parell d’anys, com a molt”, la veu sintètica ja serà la que llegirà els llibres de no-ficció a Espanya. La fi d’un altre ofici, el dels dobladors, per culpa de les màquines? “No, quedaran només els de més qualitat, que a més funcionaran com un valor afegit, un reclam tipus: ‘Llibre gravat amb veu humana’”.

S'adhereix als criteris de The Trust Project Més informació >