RSS

Comprensión lingüística en EVP : Un experimento de precisión sobre la percepción auditiva.

03 May

Por  Michael J. Baker

 -Scientific Research Dept., New England Centre for the Advancement of Paranormal Science, Salem, MA.

Desde mediados del siglo XX la EVP (Fenómenos de Voz Electrónica) ha sido objeto de innumerables debates. Entre ellos se encuentra la interpretación de lo que realmente se está hablando o captando en cada grabación. Como la mayoría de las grabaciones de EVP son de baja calidad y su análisis fonético es a menudo difícil, por lo tanto, la mayoría de los investigadores confían en su audiencia y las interpretaciones audibles para determinar los contenidos en cada archivo. El objetivo de este experimento es establecer el porcentaje de exactitud en la que el oído humano puede identificar las palabras habladas en declaraciones al azar contenidas en grabaciones de baja calidad. Para llevar a cabo este experimento hemos creado veinte grabaciones EVP simuladas, cada una con ruidos similares y estilos vocales (el habla normal, susurros, murmullos, etc.) como los encontrados en grabaciones supuestamente anómalas. Las grabaciones fueron creadas en varios ambientes por tres miembros del personal de NECAPS (C. Wong, B. Hantzis, M. Baker) y se presentan dentro de dos encuestas separadas, mostrándose cada grabación independientemente. Los voluntarios escucharon las grabaciones y reportaron las palabras (si las hubieran) que sentían contenidas en cada archivo. Los resultados (123 para la encuesta 1A y 108 por encuesta 1B) fueron descargados y analizados para su clasificación de precisión y establecer patrones de percepción. Nuestros resultados han demostrado que ninguno de los voluntarios obtuvo por encima del 80% de precisión para la encuesta 1A y 50% para la encuesta 1B. El porcentaje promedio de precisión para la encuesta 1A fue del 49% y la encuesta 1B fue del 28%. Los resultados de este experimento indican que la percepción humana no es una metodología precisa para la determinación de palabras no contextuales hablado contenidas en una grabación de EVP. Interpretaciones inexactas parecen deberse a diversos obstáculos neurológicos y psicológicos, tales como diversos sesgos, anticipaciones y pareidolias. Estos obstáculos afectan en gran medida la comprensión y la objetividad  de la perspectiva del oyente.

INTRODUCCIÓN

Hay un amplio debate desde hace tiempo en el mundo de la investigación paranormal, el cual rodea la eficacia de la capacidad y acierto de comprensión del investigador en el entendimiento de las palabras que se captan en las supuestas grabaciones EVP. Los efectos de influencias subliminales como la pareidolia, apofenia y prejuicios hacen un discernimiento objetivo de identificación lingüístico difícil. Muy a menudo, una perspectiva personal en conjunción con las situaciones antes mencionadas tienden a presagiar el análisis lógico y la comprensión de los resultados audibles.

Bajo estas condiciones objetivas de investigación y sin métodos estadísticos o no sesgados de ayuda, puede no sean posible ya que muchos investigadores han proclamado la dificultad en el proceso observacional y lógico de la aparente evidencia presentada por sus propias facultades. A menudo, la solución a este proceso de mistificación es eliminar la observación personal y la opinión de la metodología de la investigación para dejar gran parte de los resultados a los datos estadísticos recogidos bajo estrictos controles. Cabe señalar, que la investigación contenida en este documento no sirve para confirmar ni negar el concepto de seres existenciales, ni sirve para establecer una explicación para la existencia de la EVP,la finalidad de este trabajo está basado en examinar el nivel de precisión de la percepción humana en lo que respecta a la comprensión referente a la comunicación lingüística anómala contenida en las grabaciones EVP.

MATERIALES Y MÉTODOS

Desde que se captan grabaciones EVP se alega que su origen viene a partir de fuentes desconocidas, y la identificación de su contenido sigue siendo enigmático y sujeto a conjeturas. Por lo tanto, a fin de establecer un control fiable encontramos necesario crear grabaciones simuladas con ruido de fondo y con patrones del habla similares a los encontrados en los eventos EVP. Dado que las grabaciones son de nuestro propio diseño,  nos permite probar con precisión la eficacia de la percepción auditiva humana.

Hemos creado un total de veinte grabaciones simuladas (EVP) con diferentes niveles de ruido de fondo y complejidad. El ruido de fondo varió de (-111.9dB a -84.2dB) y contenía elementos comunes como el silencio, el viento, el agua (corriendo) y el movimiento de objetos dentro del entorno de grabación. Los niveles de habla variaron desde el susurro al volumen medio (-25.7dB) y la velocidad de cada palabra o declaración varió desde rápido a ligeramente letárgico. El propósito de estas variaciones fue para ayudarnos a identificar qué condiciones eran óptimas para lograr el mayor porcentaje de exactitud. Las palabras que se trataban en cada grabación fueron elegidas por tres miembros del personal NECAPS responsable de registrar las muestras. El contenido, aunque no fue dictado específicamente, varía entre declaraciones y palabras comunes a frases inusuales y nombres de marcas. Varios archivos incluyen un galimatías o un no hablar con lógica. El propósito de la palabra fue entender la posible presencial de un efecto pareidólico o sesgo. Si los voluntarios que escuchan los archivos, reconocían la identificación de palabras en las declaraciones “sin voz”, que podríamos atribuir esas respuestas a algunas variaciones de influencia mental (pareidolia) o tal vez incluso un cierto nivel de anticipación o confirmación / sesgo situacional.

Los veinte archivos se dividieron en dos encuestas con diez preguntas cada una y se presentaron a los voluntarios a través de Internet a partir de 1 de enero 2014 hasta el 31 de diciembre de 2014. Cada archivo de audio fue presentado individualmente en orden aleatorio y los voluntarios fueron instruidos para escuchar cada grabación e informar de lo que habían oído o, en algunos casos, no se oía. Si se considera que el archivo era como “no identificable”, los voluntarios fueron instruidos para introducir la frase “I don’t know” (“No lo sé”) o la palabra “Nothing” (“Nada”). Todas las demás respuestas debían ser escritas textualmente en un cuadro de texto abierto. No se utilizaron respuestas de opción múltiple. Las palabras mal escritas y transcripciones erróneas no afectaron el resultado final de las encuestas y cada respuesta fue de doble control visual para garantizar los resultados estadísticos de cada encuesta.

PALABRAS Y FRASES

Encuesta 1A

1 It’s Raining
2 It’s Hot In Here
3 Dog
4 Gibberish
5 Gibberish
6 Gibberish
7 Hi
8 Can’t Breathe
9 Lobster
10 Tostitos

Encuesta 1B

1 String Theory
2 Kill Zak Bagans
3 Lens Cleaner
4 Cartwheel
5 Stand Off
6 Get in my Belly
7 Fraud
8 You want fries with that?
9 Soft Kitty Warm Kitty
10 Spiderman

RESULTADOS

Los resultados muestran las tasas de precisión de 123 encuestados producidos por la Encuesta 1A y 108 entrevistados para la encuesta 1B.

DISCUSIÓN

Los resultados estadísticos de nuestras encuestas parecen seguir un patrón. En Encuesta 1A, las respuestas incomprensibles más precisos, no se componen de declaraciones o palabras comunes y por el contrario las respuestas menos precisas parecen consistir en palabras y frases más oscuros o desconocidos. Esto puede sugerir que el oyente tiende a tener una mayor facilidad de interpretar frases o declaraciones de las que han tenido más experiencia personal o la exposición. Para investigar esta hipótesis se realizó una serie posterior de tres encuestas (que consta de 245 participantes en total) que se presentaron de forma independiente en 6 diferentes sitios web de medios sociales, foros públicos y blogs. Se pidió a los voluntarios para organizar las palabras y frases utilizadas en la Encuesta 1A y 1B Encuesta independiente, así como las dos encuestas 1A y 1B colectivamente en un orden de lo que ellos consideran como las palabras y frases más comunes a menos común. Las encuestas se llevaron a cabo durante varios días y los resultados son como sigue (Fig 5, Fig 6 y Fig 7):

Como se observa en la tabla anterior (figura 5), ​​palabras y frases tales como “Hi”, “Dog” y “It’s Raining” fueron consideradas como las palabras y frases más comunes que se presentan en la encuesta 1A, mientras que “Lobster” y “Tostitos” estuvieron siempre en la parte inferior de la lista. En Encuesta 1B (Fig. 6), “Stand Off”, “Spiderman” y “Cartwheel” encabezó la lista como las más comunes mientras que las palabras y frases como “Lens Cleaner”, “Get in my Belly” y “Kill Zak Bagans” se consideraron menos comunes. Al ver las listas combinadas de ambas encuestas 1A y 1B (figura 7) “Hi”, “Dog” y “It’s a Raining” siguen siendo las más reconocidas. “Stand Off”, “Cartwheel” y “Spiderman” se presentan como menos comunes y “Lobster”, “Tostitos”, “Kill Zak Bagans”, “Lens Cleaner” y “Get in my Belly” se mantuvieron en o cerca del final de la lista como menos reconocibles.

Los resultados de las encuestas secundarias parecen correlacionarse con los resultados de las encuestas de audio 1A y 1B. Esta correlación propuesta es apoyada por las posiciones estadísticas o filas de cada palabra en cada encuesta. Por ejemplo, “It’s Rainig”, “Dog” y “Hi” no sólo eran los más fáciles de identificar en la encuesta 1A, pero también se consideran tres de las palabras más comunes en la comunicación diaria de acuerdo con los resultados de las encuestas secundarias. Estos datos sugieren que esas palabras y frases que son más fácilmente identificables en nuestro experimento, fueron también las palabras y frases que se consideran como los más comunes en la comunicación diaria, apoyando así a la inferencia hipotética que la interpretación de las palabras contenidas no contextuales, grabadas y audio de una sola expresión están sujetas a un cierto nivel de sesgo, la anticipación o la percepción por defecto.

El proceso de la percepción del habla se facilita mucho con varios elementos lingüísticos. Entre ellos se encuentra la morfología, que es la identificación, el análisis y descripción de la estructura de los morfemas de una lengua determinada y otras unidades lingüísticas, como las raíces de palabras, afijos, partes del discurso, entonaciones y las tensiones, o el contexto implícito. Igualmente es influyente la sintaxis (estructura de la oración) y la semántica, que es la relación entre significantes, como las palabras, frases, signos y símbolos, y lo que representan (semiótica). Hay una clara posibilidad de que los oyentes no tienen la capacidad de reconocer fonemas antes de reconocer unidades superiores, tales como palabras. Después de obtener la información fundamental sobre la estructura fonética, los oyentes normalmente pueden compensar fonemas inaudibles o ruidos enmascarados utilizando sus conocimientos de la lengua hablada.

La investigación adicional ha demostrado que las palabras habladas, naturalmente, cuando se presentaron en una oración o frase se identificaron con mayor precisión en comparación con las mismas palabras presentadas de forma aislada. Garnes y Bond (1976) han demostrado que los oyentes suelen tener una tendencia a juzgar las palabras ambiguas de acuerdo con el significado de toda la oración o frase. Esto se conoce como el efecto de la restauración del fonema  y podría ayudar a entender por qué muchos investigadores identifican incorrectamente las inclusiones e EVP en sus idiomas nativos.

Aunque el idioma principal que se utiliza en las encuestas 1A y 1B es el Inglés, es nuestra hipótesis de que las variaciones en el lenguaje presentarían un obstáculo importante en el reconocimiento de voz, por lo que la identificación audible de lenguas extranjeras contenidas en grabaciones podían ser extremadamente difíciles mediante las EVP. Las lenguas difieren en sus inventarios fonológicos. Si dos sonidos de una lengua extranjera se asimilan a una sola categoría de la lengua materna, la diferencia entre ellos va a ser muy difícil de discernir. Un ejemplo clásico de esta situación es la observación de los estudiantes japoneses de Inglés, pues tienen serios problemas con la identificación o distinción  de varias consonantes (/ l / y / r /)].

El proceso de percibir el habla comienza en el nivel de la señal de sonido y el proceso de audición. Después de procesar la señal auditiva inicial, los sonidos del habla se procesan adicionalmente para extraer las señales acústicas y la información fonética. Esta información de voz puede ser utilizada para los procesos del lenguaje de alto nivel, como el reconocimiento de las palabras. Un aspecto acústico de la señal de voz puede estar en diferentes dimensiones lingüísticamente pertinentes. Por ejemplo, la duración de una vocal en Inglés puede indicar si está o no la vocal  estresada, o si está en una sílaba cerrada por una sonora o una consonante sorda, y en algunos casos (como el Inglés americano / ɛ / y / æ /) se puede distinguir la identidad de las vocales. Algunos expertos sostienen incluso que la duración pueden ayudar a distinguir de lo que tradicionalmente se llama vocales cortas y largas en Inglés. Curiosamente, dos de las palabras más identificadas con precisión (“Hi “y” Dog “) también contienen la duración vocal larga. Esto, combinado con la naturaleza común de las palabras puede haberse añadido a la facilidad de su identificación.

Adicionalmente, una unidad lingüística puede ponerse en cuarentena por varias propiedades acústicas. Alvin Liberman (1957) mostró que las transiciones de formantes de inicio /d/ difieren dependiendo de la vocal siguiente pero todos se interpretan como el fonema /d/ por los oyentes. Esta falta de discernimiento de formantes de inicio pueden contribuir a un mayor nivel de interpretación errónea de palabras, particularmente en los estados donde no existen segmentos comunes vocálicos y se ocluyen por el ruido, o de otra manera no identificable. Este efecto puede posiblemente ser observado en varios resultados contenidos en las encuestas 1A y 1B, en particular en el patrón general de respuestas incorrectas. Mientras que las respuestas no son correctas, se ha dado el mismo resultado a partir de las consonantes y, en varios casos,las vocales posteriores que son del  mismo o similar rango de frecuencias de los formantes.
Las señales acústicas, como el tiempo de inicio de voz (VOT) ayudan a diferenciar entre categorías fonéticas separadas. VOT es una señal primaria que señala la diferencia entre oclusivas orales sonoras y sordas (conocidas como oclusivas – [t] [d] [k] [ɡ] [p] [b] [ʔ]). Otras señales diferencian los sonidos que se producen en distintos lugares o maneras de articulación. El sistema de voz también debe combinar estas señales para determinar la categoría de un sonido de voz específica. Esto es, a menudo considerado en términos de representaciones abstractas de fonemas. Estas representaciones se pueden combinar para su uso en otros procesos del lenguaje de reconocimiento de palabras. No es fácil identificar qué claves acústicas oyentes son sensibles al percibirse un sonido del habla en particular, por lo tanto, identificar las razones específicas de un oyente encuentra el éxito a lo largo del siguiente, pues  en términos de respuesta a las mismas preguntas, puede no ser posible.

Uno de los problemas básicos en el estudio del habla es cómo lidiar con el ruido en la señal de voz. Este problema se demuestra por el ruido de la computadora y la dificultad de los sistemas de reconocimiento tienen con los patrones de la voz humana. Estos programas pueden hacer bien el reconocimiento de voz cuando han sido entrenados en la voz de un altavoz específico, y en condiciones tranquilas. Sin embargo, estos sistemas, a menudo, no son válidos en situaciones de escucha -más realistas- donde los humanos pueden entender el habla sin dificultad. Cuando el ruido excede o coincide con el nivel de decibelios de líneas formantes F1 o F2 (150 Hz-5000 Hz), habrá una disminución significativa en la capacidad del oyente para discernir correctamente la estructura de vocales del fonema de la palabra que se habla. Bajo esta condición, el efecto de la restauración de fonemas se vuelve frecuente y aparecen lagunas en la palabra  o frase que se “rellena” a través del proceso de anticipación del oyente.

Sin embargo, cabe señalar que bajo ciertas condiciones, tipos específicos de ruido de fondo posiblemente pueden aparecer a mejorar la capacidad de percepción del habla de un oyente. Por ejemplo, la tasa de éxito de “It’s Raining” -en la encuesta 1A- puede atribuirse en parte al sonido sutil de agua en el fondo. Puesto que no había archivos de control creados por las mismas palabras sin el sonido del agua, y no tenemos forma de determinar su efecto en la precisión de la percepción.

Aunque las edades de los participantes no se registraron durante el proceso de experimentación, pensamos que la edad puede ser una dimensión útil para extrapolar en futuros experimentos. La presbiacusia -pérdida auditiva neurosensorial progresiva bilateral simétrica- asociada a la edad se observa sobre todo en frecuencias más altas. Aunque el oído humano comienza a deteriorarse sobre los 18 años de edad con frecuencias superiores a 15 o 16Khz, los efectos no se notan hasta años más tarde, cuando la detección de sonidos agudos se hace difícil y la percepción del habla se ve afectada, en particular de las sibilantes y fricativas ([ s], [z], [ʃ] y [ʒ]). Desde sibilantes y fricativas se distribuyeron equitativamente entre ambas muestras interpretadas con precisión y las muestras menos identificadas, no sentimos que los efectos de la presbiacusia -según las edades de los participantes- tengan ninguna incidencia significativa en el resultado estadístico de esta investigación.

A primera vista, la solución al problema de la forma en que percibimos el habla parece engañosamente simple. Si se pudiera identificar tramos de la forma de onda acústica que corresponden a unidades específicas de percepción, entonces el camino de sonido al significado sería clara. Sin embargo, esta correspondencia o mapeo ha demostrado ser extremadamente difícil de encontrar. Es nuestra posición que registra las declaraciones analizadas sin el beneficio del contexto de la conversación son por lo tanto más difícil de entender. La relación entre las declaraciones y la materia en última instancia puede aumentar la comprensión hasta en un 40%.

CONCLUSIÓN

Muchas personas tienen dificultades para aceptar la falibilidad de sus propios métodos de interpretación, y con razón. Nuestra capacidad de interpretar la comunicación lingüística es la base misma de nuestro desarrollo social y educativo. Es el principal responsable de nuestra capacidad de vivir y la razón en un mundo civilizado. Sin embargo, la diferencia entre nuestra percepción del mundo y de nuestra percepción de la EVP se encuentra dentro del contexto y el proceso de la comunicación. Cuando los seres humanos aprenden, a menudo hay más de una dimensión informativa presente para ayudar en la comprensión. Por ejemplo: Los libros tienen presentaciones, fotos y gráficos. Los maestros tienen anécdotas, ejemplos y demostraciones. La vida tiene una cadena de experiencias, personajes y objetos que llevan hasta el momento de aprendizaje. Todas estas cosas nos ayudan a construir una base en la preparación para la nueva información que se ha recibido y comprendido. Sin ellos, incluso las ideas más simples serían difíciles de entender. El idioma no es diferente. Palabras al azar y frases sin contexto son difíciles de interpretar, independientemente de la simplicidad y la claridad de las palabras que se pronuncien. Esta dificultad aumenta con la oscuridad de la palabra o frase que se comunican. Para compensar estas fallas de la mente humana hay que buscar primero las conexiones a lo que se siente como más familiar. Como resultado, las palabras comunes serán más fácilmente identificadas (de nuevo, independientemente de su simplicidad). Este proceso y el resultado se indica en nuestra comparación entre los resultados estadísticos de encuestas 1A y 1B y las encuestas secundarias.

Cuando una sección familiarizada no se encuentra en el proceso de anticipación (principalmente cuando se perciben frases u oraciones) inicia. Por lo general e involuntariamente, utilizamos el proceso de anticipación con frecuencia en nuestra vida cotidiana. Por ejemplo: Cuando leemos la frase “I need to walk my ____.”(“Yo necesito caminar con mi ____”).  La mayoría de las veces nuestra mente llenará automáticamente el espacio en blanco con la respuesta más común, (que en este caso es Dog (Perro). Este proceso también se demuestra entre las personas, quienes acaban las frases de otro.

Hacemos esto porque el proceso de la percepción del habla humana trabaja desde el nivel de arriba hacia abajo, lo que significa que primero identificamos las palabras antes de identificar las letras y otros elementos de detalle que los componen. Cuando el contexto no está disponible para ayudar en la precisión de nuestro proceso de anticipación, podemos llenar los espacios en blanco de forma incorrecta, llegando a  la incomprensión en la comunicación. Es aquí donde estamos sujetos a los efectos de la pareidolia, la influencia externa y/o sesgos situacionales/confirmación. Este efecto sesgado puede llenar los espacios en blanco con las palabras que vivimos con nuestras expectativas personales, pensamientos o creencias y de este modo fabricar el contenido original de la comunicación a nuestro libre albedrío.

Cuando se produce este efecto durante el análisis de la EVP, el resultado puede a veces crear una falsa impresión de interacción inteligente desde el oyente “llenar los espacios en blanco” con palabras que se viven durante la investigación, el medio ambiente, las aportaciones del exterior o sus creencias personales. Esto puede conducir a una contaminación de la objetividad. Una vez que el oyente anuncia verbalmente una interpretación errónea de una grabación, corre el peligro de influir en el proceso de percepción de los demás a través de la contaminación sugestiva. La mente humana es limitada en términos de discriminación en relación con la calidad de los datos externos. Simplemente no tiene la capacidad de procesamiento para ser tan exigente como tiene que ser entre todos sus otros procesos. Por lo tanto, a menudo se emparejará incorrectamente el conocimiento con la información sensorial basada en fonética básica y estructura de la oración,y la omisión de muchos de los detalles importantes que se requieren para la percepción correcta. Este efecto se ve a menudo cuando no se identifican letras de canciones. Debido a que estamos sometidos a esta forma de percepción defectuosa, podemos estar fácilmente influenciados por las sugerencias de que se aproximen a nuestras expectativas y/u observaciones.

En resumen, nuestra investigación sugiere que sin una relación contextual o situacional directa a la verdadera naturaleza de las declaraciones contenidas en grabaciones EVP, la percepción de los oyentes y lo que realmente se está diciendo se puede esperarse que sea incorrecto, igual que el 56% de las veces debido a diversas influencias que describen en este trabajo. Por lo tanto, la interpretación personal de las EVP contenidas en la grabación (independientemente de la confianza del oyente, en su capacidad de escucha y de la percepción) no es una metodología fiable cuando se aplica a la investigación de hechos.

 

 

Fuente.

Anuncios
 
 

Etiquetas: , , , , , ,

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

 
A %d blogueros les gusta esto: