Información

¿Es un problema utilizar un modelo para la selección de estímulos, cuando el mismo modelo se prueba más tarde con los datos de fMRI basados ​​en esos estímulos?

¿Es un problema utilizar un modelo para la selección de estímulos, cuando el mismo modelo se prueba más tarde con los datos de fMRI basados ​​en esos estímulos?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Estoy planeando un experimento de resonancia magnética funcional que analiza la similitud de la activación del cerebro humano cuando se le solicita con palabras conocidas.

El objetivo del experimento es comparar la similitud de la activación con las predicciones realizadas por un modelo. Para obtener una buena comparación, lo ideal sería que la similitud entre las palabras de estímulo se extendiera uniformemente.

¿Existe un problema potencial con el uso del mismo modelo para seleccionar estímulos de una variedad de similitudes predichas?

Tenga en cuenta que el análisis no hará presunciones sobre la similitud de palabras distintas de las que se muestran a partir de los datos, por lo que debemos evitar el análisis circular (Kriegeskorte et al, 2009). Las predicciones del modelo no influyen en el análisis de datos hasta la comparación final entre las similitudes observadas y predichas en la activación. Todavía se siente intuitivamente como si pudiera haber un problema de hallazgos falsos a través de la selección de estímulos, pero no puedo encontrar / verbalizar un problema real.

Una alternativa sería utilizar la literatura existente para identificar una lista de palabras con una extensión uniforme de similitud entre las palabras. Pero como nuestro modelo se basa, por supuesto, en esa literatura, en la práctica esto daría como resultado una lista de palabras muy similar.


Limitaciones de la teoría de la difusión de la innovación

Existen varias limitaciones de la teoría de la difusión de la innovación, que incluyen las siguientes:

  • Gran parte de la evidencia de esta teoría, incluidas las categorías de adoptantes, no se originó en la salud pública y no se desarrolló para aplicarse explícitamente a la adopción de nuevos comportamientos o innovaciones de salud.
  • No fomenta un enfoque participativo para la adopción de un programa de salud pública.
  • Funciona mejor con la adopción de comportamientos en lugar de la cesación o prevención de comportamientos.
  • No tiene en cuenta los recursos o el apoyo social de un individuo para adoptar el nuevo comportamiento (o innovación).

Esta teoría se ha utilizado con éxito en muchos campos, incluidos la comunicación, la agricultura, la salud pública, la justicia penal, el trabajo social y el marketing. En salud pública, la Teoría de la Difusión de la Innovación se utiliza para acelerar la adopción de importantes programas de salud pública que típicamente apuntan a cambiar el comportamiento de un sistema social. Por ejemplo, se desarrolla una intervención para abordar un problema de salud pública y se promueve la intervención a las personas en un sistema social con el objetivo de adopción (basado en la Teoría de Difusión de la Innovación). La adopción más exitosa de un programa de salud pública resulta del conocimiento de la población objetivo y los factores que influyen en su tasa de adopción.

Para obtener más información sobre la teoría de la difusión de la innovación, consulte "Sobre la difusión de innovaciones: cómo se difunden las nuevas ideas" por Leif Singer.


Aprendizaje basado en la curiosidad en bebés: un enfoque neurocomputacional

Katherine E. Twomey, División de Comunicación Humana, Desarrollo y Audición, Universidad de Manchester, Coupland 1, Oxford Road, Manchester M13 9PL, Reino Unido.

Departamento de Psicología, Universidad de Lancaster, Lancaster, Reino Unido

División de Comunicación Humana, Desarrollo y Audición, Facultad de Ciencias de la Salud, Universidad de Manchester, Manchester, Reino Unido

Katherine E. Twomey, División de Comunicación Humana, Desarrollo y Audición, Universidad de Manchester, Coupland 1, Oxford Road, Manchester M13 9PL, Reino Unido.

Departamento de Psicología, Universidad de Lancaster, Lancaster, Reino Unido

ESRC International Center for Language and Communicative Development (LuCiD), una beca de ESRC Future Research Leaders para KT y una beca de investigación senior de la Academia Británica / Leverhulme Trust para GW. Consejo de Investigaciones Económicas y Sociales (ES / L008955 / 1 ES / N01703X / 1).


Implicaciones más amplias [editar | editar fuente]

Aunque la mayor parte de la investigación sobre ceguera por falta de atención se ha realizado en estudios de laboratorio, el fenómeno se produce en una variedad de contextos cotidianos. Dependiendo del contexto, la ocurrencia de ceguera por falta de atención puede variar desde vergonzosa y / o humorística hasta potencialmente devastadora.

Ceguera y seguridad por falta de atención [editar | editar fuente]

Varios estudios recientes sobre la captación explícita de la atención han descubierto que cuando los observadores se centran en algún otro objeto o evento, a menudo experimentan ceguera por falta de atención. & # 9127 & # 93 Este hallazgo tiene implicaciones potencialmente trágicas para la conducción distraída. Si la atención de una persona se centra en otra parte mientras conduce, mantiene una conversación o envía mensajes de texto, por ejemplo, es posible que no se dé cuenta de los objetos destacados y distintivos, como una señal de alto, lo que podría provocar lesiones graves e incluso la muerte. También ha habido incidentes atroces atribuidos a ceguera por falta de atención al volante. Por ejemplo, un equipo de carreteras de Pensilvania pavimentó accidentalmente un querido muerto que estaba en la carretera. Cuando se les preguntó sobre sus acciones, los trabajadores afirmaron que nunca habían visto al ciervo muerto. & # 9128 & # 93

Se están implementando muchas políticas en todo el mundo para disminuir la competencia por captar la atención explícitamente mientras se opera un vehículo. Por ejemplo, hay iniciativas legislativas en muchos países encaminadas a prohibir o restringir el uso de teléfonos móviles mientras se conduce. La investigación ha demostrado que el uso de dispositivos móviles de manos libres y de mano durante la conducción provoca que la atención no capte explícitamente otros objetos destacados y distintivos, lo que lleva a tiempos de reacción significativamente retrasados, así como a ceguera por falta de atención. & # 9129 & # 93 De manera alarmante, un estudio publicado en 1997, basado en datos de accidentes en Toronto, encontró que el riesgo que implica conducir mientras se usa un teléfono celular es similar al de conducir ebrio. En ambos casos, el riesgo de colisión era de tres a seis veces mayor en comparación con un conductor sobrio que no usaba un teléfono celular. & # 9130 & # 93 Además, Strayer et al. (2003) encontraron que al controlar la dificultad de conducción y el tiempo dedicado a la tarea, los conductores de teléfonos móviles mostraban un mayor deterioro que los conductores ebrios, utilizando un simulador de conducción de alta fidelidad. & # 9131 & # 93

La ceguera por falta de atención también es frecuente en la aviación. El desarrollo de la pantalla Heads-up (HUD) para pilotos, que proyecta información en el parabrisas o en una pantalla montada en el casco, ha permitido a los pilotos mantener la vista en el parabrisas, pero los estudios con simuladores han encontrado que el HUD puede causar accidentes de incursión en la pista. , donde un avión choca con otro en la pista. & # 9125 & # 93 Este hallazgo es particularmente preocupante porque los HUD se están volviendo más comunes en los automóviles, lo que podría conducir a posibles incursiones en las carreteras. & # 9125 & # 93 Cuando un objeto o evento en particular capta la atención en la medida en que la capacidad de atención de los espectadores se absorbe por completo, se sabe que la ceguera por falta de atención resultante causa accidentes dramáticos. Por ejemplo, la tripulación de un avión de pasajeros, absorta en una luz de consola parpadeante, no se percató del terreno que se acercaba y no se registró al escuchar la alarma de peligro que sonaba antes de que el avión se estrellara. & # 9125 & # 93

Magia y ceguera por falta de atención [editar | editar fuente]

Los esfuerzos colaborativos para establecer vínculos entre la ciencia y la magia han examinado la relación de los procesos subyacentes a la ceguera por falta de atención y el concepto de desvío: la capacidad de un mago para manipular la atención para evitar que su audiencia vea cómo se realiza un truco. En varios estudios de desvío de direcciones, incluidos Kuhn y Tatler (2005), & # 9132 & # 93 los participantes observan un truco de magia de "elemento que desaparece". Después de la prueba inicial, a los participantes se les muestra el truco hasta que detectan que el objeto se cae de la mano del mago. La mayoría de los participantes ven caer el artículo en la segunda prueba. Los análisis críticos involucraron diferencias en los movimientos oculares entre los ensayos detectados y no detectados. Estos ensayos de repetición son similares al ensayo de atención total en el paradigma de ceguera por falta de atención, ya que ambos implican la detección del evento inesperado y, al detectar el evento inesperado en el segundo ensayo, demuestran que el evento es fácilmente perceptible. & # 9133 & # 93

La principal diferencia entre la ceguera por falta de atención y la mala dirección implica cómo se manipula la atención. Mientras que las tareas de ceguera por falta de atención requieren un distractor explícito, la distracción de la atención en la mala dirección se produce a través de la orquestación implícita pero sistemática de la atención. & # 9134 & # 93 Además, existen varias variedades de desvío y es probable que diferentes tipos induzcan diferentes procesos cognitivos y perceptuales, que varían el parecido del paradigma del desvío a la ceguera por falta de atención. & # 9134 & # 93

Aunque los objetivos de la magia difieren de los de la neurociencia, los magos desean explotar las debilidades cognitivas, mientras que los neurocientíficos buscan comprender el cerebro y el significado neuronal de las funciones cognitivas. Varios investigadores han argumentado que los neurocientíficos y psicólogos pueden aprender mucho al incorporar la experiencia y el conocimiento del mundo real de los magos en sus campos de investigación. Las técnicas desarrolladas durante siglos de magia escénica por magos también pueden ser utilizadas por la neurociencia como poderosas sondas de la cognición humana. & # 9135 & # 93


¿Es hora de dejar atrás el modelo jerárquico revisado de procesamiento del lenguaje bilingüe después de quince años de servicio?

El modelo jerárquico revisado (RHM) del procesamiento del lenguaje bilingüe domina el pensamiento actual sobre el procesamiento del lenguaje bilingüe. Recientemente, se han cuestionado los principios básicos del modelo. Primero, hay poca evidencia de léxicos separados. En segundo lugar, hay poca evidencia de acceso selectivo al idioma. En tercer lugar, es probable que la inclusión de conexiones excitadoras entre equivalentes de traducción a nivel léxico impida el reconocimiento de palabras. Cuarto, las conexiones entre las palabras L2 y sus significados son más fuertes que las propuestas en RHM. Y finalmente, hay buena evidencia para hacer una distinción entre características semánticas dependientes del lenguaje e independientes del lenguaje. Se argumenta que el modelo jerárquico revisado no se puede adaptar fácilmente para incorporar estos desafíos y que una forma más fructífera es partir de los modelos computacionales existentes de procesamiento del lenguaje monolingüe y ver cómo se pueden adaptar para la entrada y salida bilingües, como se ha hecho. realizado en el modelo de Activación Interactiva Bilingüe.


Agradecemos a los laboratorios de Cichy y Kamitani por compartir los datos de fMRI, así como a Marieke Mur por el acceso a sus datos de similitud de percepción. Este proyecto recibió financiación del Cambridge Trust (Premio del Vicecanciller a JM), el Consejo de Investigación de Biotecnología y Ciencias Biológicas (BB / M011194 / 1 a ECJ), la Fundación Alemana de Ciencias (subvención DFG “DynaVision” a TCK) y Horizonte de la Unión Europea Programa 2020 (Acuerdo de subvención No. 720270, 785907 a NK).

Contribuciones de los autores: J.M., N.K. y T.C.K. diseñó la investigación J.M., C.J.S., E.C.J., N.K. y T.C.K. realizó la investigación C.J.S. y E.C.J. contribuyó con nuevos reactivos / herramientas analíticas J.M. y T.C.K. datos analizados y J.M., C.J.S., E.C.J., N.K. y T.C.K. escribió el periódico.

Los autores declaran no tener intereses en competencia.

Este artículo es una presentación directa de PNAS.

Este artículo de acceso abierto se distribuye bajo Creative Commons Attribution License 4.0 (CC BY).


Conclusiones

Hemos examinado las relaciones entre la preparación de la repetición del comportamiento, la supresión de la repetición neuronal y la conectividad cerebral en relación con los modelos de Sincronía, Codificación Predictiva, Afilado y Facilitación. Se descubrió que la supresión de la repetición y la conectividad son en gran medida independientes entre sí en sus contribuciones a la preparación de la repetición. Si bien los cambios de conectividad son más compatibles con el modelo Synchrony, todos los modelos actuales no logran explicar las correlaciones entre el cebado y la supresión de repetición que no están mediadas por la conectividad.


MATERIALES Y MÉTODOS

Experimento EEG

Participantes

Los datos de EEG se obtuvieron de 96 voluntarios sanos (51 mujeres) de 21,6 ± 1,7 años (media ± DE, rango = 17-25 años). Todos los voluntarios dieron su consentimiento informado por escrito y se les pagó por su participación. El comité de ética local aprobó los procedimientos experimentales. Se publicó un análisis diferente del mismo conjunto de datos [Hu et al., 2014].

Diseño experimental

Se generaron estímulos de calor radiante específicos para nociceptivos mediante un láser infrarrojo de neodimio, itrio y aluminio perovskita (Nd: YAP) con una longitud de onda de 1,34 μm (Ingeniería electrónica). Estos pulsos de láser activan selectivamente los terminales nociceptivos Aδ y C ubicados dentro de la epidermis, sin coactivar las fibras Aβ ubicadas en la dermis [Baumgärtner et al., 2005]. El rayo láser se transmitió a través de una fibra óptica y su diámetro se fijó en aproximadamente 7 mm (~ 38 mm 2) mediante lentes de enfoque. Los pulsos de láser se dirigieron sobre un área cuadrada (5 x 5 cm 2) centrada en el dorso de la mano izquierda. La duración del pulso fue de 4 ms y se utilizaron cuatro intensidades de estimulación (E1: 2,5 J E2: 3 J E3: 3,5 J E4: 4 J). Después de cada estímulo, el objetivo del rayo láser se desplazó aproximadamente 1 cm en una dirección aleatoria para evitar la fatiga o la sensibilización del nociceptor.

Entregamos 10 pulsos de láser en cada una de las cuatro intensidades de estímulo (E1-E4), para un total de 40 pulsos, utilizando un intervalo interestímulo aleatorio y variable entre 10 y 15 s (distribución rectangular). El orden de las intensidades de los estímulos fue pseudoaleatorizado. De tres a seis segundos después de cada estímulo, se instruyó a los sujetos para que calificaran la intensidad de la sensación dolorosa provocada por el pulso láser, utilizando una escala analógica visual (EVA) que iba de 0 (correspondiente a "sin dolor") a 10 (correspondiente a " dolor tan fuerte como podría ser ”) [Jensen y Karoly, 1992]. La intensidad del dolor percibida a diferentes energías de estímulo se comparó mediante un análisis de varianza de medidas repetidas unidireccionales (ANOVA). Cuando el efecto principal fue significativo, se realizaron comparaciones por pares post-hoc de Tukey.

Grabación de EEG

Los sujetos estaban sentados en una silla cómoda en una habitación silenciosa y con temperatura controlada. Llevaban gafas protectoras y se les pidió que centraran su atención en los estímulos y relajaran los músculos. Los datos de EEG se registraron utilizando 64 electrodos de cuero cabelludo Ag-AgCl colocados de acuerdo con el sistema internacional 10-20 (Brain Products GmbH Munich, Alemania, paso de banda: frecuencia de muestreo de 0,01 a 100 Hz: 1000 Hz), utilizando la nariz como referencia. Las impedancias de los electrodos se mantuvieron por debajo de 10 kΩ. Las señales electrooculográficas (EOG) se registraron simultáneamente utilizando electrodos de superficie para monitorear los movimientos oculares y los parpadeos de los ojos.

Análisis de datos de EEG

Preprocesamiento de datos de EEG y análisis en el dominio del tiempo

Los datos de EEG se preprocesaron utilizando EEGLAB [Delorme y Makeig, 2004]. Los datos de EEG continuos se filtraron en paso de banda entre 1 y 100 Hz y se segmentaron en épocas utilizando una ventana de tiempo de 1.500 ms (-500 a 1000 ms en relación con el inicio del estímulo). Los ensayos de EEG se corrigieron en la línea de base utilizando el intervalo de preestímulo. Los ensayos contaminados por parpadeos y movimientos se corrigieron mediante un algoritmo de análisis de componentes independientes [Delorme y Makeig, 2004]. En todos los conjuntos de datos, los componentes independientes eliminados mostraron una gran contribución al canal EOG y una distribución frontal del cuero cabelludo. Finalmente, se excluyeron los ensayos de EEG con amplitudes superiores a ± 100 µV (es decir, que probablemente estén contaminados por artefactos). Para cada sujeto, los ensayos recopilados en cada nivel de energía de estímulo se promediaron juntos, bloqueados en el tiempo hasta el inicio del estímulo. Este procedimiento produjo cuatro formas de onda promedio. Las latencias máximas y las amplitudes de las ondas N2 y P2, que se definieron como las deflexiones más negativas y positivas entre 150 y 500 ms después del inicio del estímulo, se midieron en Cz para cada sujeto e intensidad del estímulo. Las latencias y amplitudes de los picos de N2 y P2 a diferentes intensidades de estímulo se compararon respectivamente usando un ANOVA de medidas repetidas unidireccionales. Cuando el efecto principal fue significativo, se realizaron comparaciones por pares post-hoc de Tukey.

Análisis de frecuencia de tiempo

Las distribuciones de tiempo-frecuencia de los ensayos de EEG se obtuvieron utilizando una transformada de Fourier en ventana (WFT) con una ventana Hanning fija de 200 ms [Zhang et al., 2012]. Esta WFT produjo, para cada ensayo de EEG, una estimación de frecuencia de tiempo compleja F(t,F) en cada punto de frecuencia de tiempo (t,F), que se extiende de -500 a 1000 ms (en pasos de 1 ms) en el dominio del tiempo, y de 1 a 100 Hz (en pasos de 1 Hz) en el dominio de la frecuencia. El espectrograma resultante, PAG(t,F) = ‖F(t,F) ‖ 2, que representa la potencia de la señal como una función conjunta del tiempo y la frecuencia en cada punto de tiempo-frecuencia, contenía respuestas cerebrales tanto bloqueadas en fase (potenciales relacionados con eventos) como no bloqueadas en fase (sincronización y desincronización relacionadas con eventos) a la estimulación con láser [Mouraux e Iannetti, 2008]. Dado que el enfoque de este estudio fue explorar la influencia de la actividad de prestimulus EEG tanto en la intensidad subjetiva del dolor como en las respuestas de EEG post-estímulo, no se realizó ninguna corrección de referencia en las distribuciones de frecuencia de tiempo. De hecho, cualquier corrección de la línea base de tiempo-frecuencia inevitablemente mezclaría la variabilidad de las actividades de electroencefalograma preestímulo y posestímulo [Hu et al., 2014].

Análisis de mínimos cuadrados parciales (PLS)

Para cada sujeto, tanto los espectrogramas de EEG como las intensidades subjetivas del dolor se normalizaron dentro de cada energía de estímulo, restando sus respectivas medias y dividiendo sus desviaciones estándar, para minimizar la influencia de la energía de estímulo en la evaluación de su relación de ensayo a ensayo. Para cada sujeto y cada electrodo, la relación entre el espectrograma EEG normalizado y la intensidad subjetiva normalizada del dolor se describió mediante un modelo de regresión lineal multivariante (MVLR) [Hu et al., 2014]. Los coeficientes del modelo, αt,F, que capturaron la importancia del espectrograma EEG en cada punto de tiempo-frecuencia en la predicción de la intensidad del dolor, se estimaron utilizando un análisis PLS (consulte Hu et al. [2014] para obtener detalles técnicos).

Para evaluar la importancia de la relación entre la magnitud de la actividad electroencefalográfica de frecuencia temporal y la intensidad del dolor, se realizó un análisis de una muestra punto por punto. t-La prueba contra cero, combinada con la prueba de permutación no paramétrica [Maris y Oostenveld, 2007], se realizó, por separado para cada electrodo, en los coeficientes estimados del modelo MVLR αt,F para definir grupos de tiempo-frecuencia significativos en cada electrodo de EEG [Zhang et al., 2012]. Específicamente, coeficiente del modelo MVLR αt,F en cada punto de frecuencia de tiempo (t,F) se comparó con cero utilizando una muestra t-prueba, produciendo un mapa de frecuencia de tiempo de t valores. Para tener en cuenta el problema de comparación múltiple en la prueba estadística punto por punto, los puntos de tiempo-frecuencia significativos (pag & lt 0.05) se categorizaron en grupos en función de su adyacencia de frecuencia de tiempo (análisis estadístico a nivel de grupo). Solo se consideraron los grupos compuestos de & gt20 puntos de frecuencia de tiempo significativos adyacentes, y solo se seleccionó el grupo más grande en el rango gamma (≥30 Hz) en los intervalos de preestímulo y posestímulo, para controlar las observaciones falsas positivas. Las estadísticas a nivel de clúster ( ) se definieron calculando la suma de los t valores de todos los puntos de frecuencia de tiempo dentro de un grupo. Para cada sujeto, permutamos aleatoriamente 1000 veces la intensidad subjetiva del dolor en cada intensidad de estímulo para construir un modelo MVLR permutado y estimamos los coeficientes correspondientes del modelo MVLR. En cada permutación (metro-th), la misma muestra única t-La prueba se realizó en los coeficientes del modelo MVLR permutados en cada punto de frecuencia de tiempo dentro de los grupos predefinidos, lo que arrojó una estadística a nivel de grupo . Distribuciones de permutación del nivel de clúster t-Las estadísticas se obtuvieron de todos , y el de dos colas pag-valor pagT se obtuvo localizando el observado bajo la distribución de permutación D(miT) para cada grupo [Benjamini y Hochberg, 1995].

Para evaluar la fuerza de los efectos de preestímulo en el cuero cabelludo, primero modelamos la relación entre los espectrogramas de EEG dentro de los grupos de tiempo-frecuencia identificados (es decir, oscilaciones alfa de preestímulo: “Pre-ABO” y oscilaciones gamma de preestímulo: “Pre-GBO” ver Sección de resultados para detalles) de todos los electrodos y la intensidad subjetiva del dolor. Luego, los coeficientes del modelo se extrajeron y se promediaron en todos los puntos de frecuencia de tiempo dentro de cada grupo para cada electrodo, lo que resultó en las topografías del cuero cabelludo de los coeficientes del modelo. Además, para evaluar la posible influencia de la energía del estímulo en la relación entre el espectrograma EEG y la intensidad del dolor dentro de los grupos de preestímulo definidos, realizamos un análisis PLS separado para cada intensidad de estímulo (E1-E4). Dentro de cada grupo de prestimulus, coeficientes del modelo MVLR αt,F a diferentes intensidades de estímulo se compararon utilizando un ANOVA de medidas repetidas unidireccional. Cuando el efecto principal fue significativo, se realizaron comparaciones por pares post-hoc de Tukey.

Efectos de las actividades de prestimulus EEG

Para evaluar la influencia de cada característica de preestímulo en la intensidad percibida del estímulo somatosensorial subsiguiente y las respuestas neurales correspondientes, se ordenaron los ensayos individuales de cada sujeto en orden ascendente de acuerdo con la potencia espectral media dentro del "Pre-ABO" o "Pre- Grupos de tiempo-frecuencia GBO ”(medidos desde C4-nose, el efecto en otros electrodos se informa en la Información de apoyo). La mitad inferior de los ensayos, que refleja el bajo "Pre-ABO" o "Pre-GBO", y la mitad superior de los ensayos, que refleja el alto "Pre-ABO" o "Pre-GBO", así como sus correspondientes intensidades de dolor. , fueron promediados. Este procedimiento produjo dos formas de onda promedio de potenciales evocados por láser (LEP) y dos valores promedio de intensidad del dolor para cada sujeto y grupo. Para cada característica de preestímulo, se midieron las latencias máximas y las amplitudes de las ondas N2 y P2 a partir de la forma de onda LEP (Cz-nose) para cada sujeto y cada nivel de potencia de preestímulo (bajo y alto). Las latencias y amplitudes máximas de N2 y P2, así como la intensidad del dolor, se compararon mediante un ANOVA de dos vías de medidas repetidas, con la intensidad del estímulo (cuatro niveles: E1-E4) y la potencia de preestímulo (dos niveles: bajo y alto) como factores intra-sujetos. Cuando la interacción fue significativa, se realizaron comparaciones por pares post-hoc de Tukey.

Además, para evaluar los efectos predictivos de "Pre-ABO" y "Pre-GBO" en todo el transcurso de tiempo de las respuestas de EEG evocadas por estímulos, el mismo ANOVA de dos vías de medidas repetidas (con energía de estímulo y potencia de preestímulo como dentro de factores del sujeto) se realizó para cada punto de tiempo de las formas de onda LEP promedio (Cz-nose, los efectos en todos los electrodos se informaron en la Información de apoyo). La importancia de este análisis se evaluó con una prueba de permutación basada en grupos, que era conceptualmente idéntica al enfoque estadístico para evaluar la importancia de la relación entre el espectrograma EEG y la intensidad subjetiva del dolor (descrita en la sección titulada "Mínimos cuadrados parciales (PLS ) análisis ”). Puntos de tiempo significativos (pag & lt 0.05) en las formas de onda LEP se clasificaron en grupos en función de su adyacencia temporal.

Independencia de las características de prestimulus EEG

Para evaluar la dependencia fisiológica entre las dos características de preestímulo ("Pre-ABO" y "Pre-GBO"), probamos si la combinación lineal y aditiva de estas características ("Pre-ABO + Pre-GBO") mejoraría significativamente la precisión de predicción de la intensidad del dolor, en comparación con cualquiera de las características de preestímulo por sí solas. Los poderes "Pre-ABO" y "Pre-GBO" se midieron en C4 de sus correspondientes grupos de tiempo-frecuencia para cada ensayo, y la intensidad del dolor se normalizó restando la media y dividiendo la desviación estándar en cada nivel de intensidad del estímulo. para eliminar la influencia sistemática de la intensidad del estímulo sobre la intensidad del dolor. Los ensayos con una intensidad de dolor normalizada inferior y superior a 0 se definieron respectivamente como ensayos de dolor alto y bajo. La predicción del dolor se logró utilizando un clasificador de máquina de vectores de soporte (SVM) con validación cruzada de dejar uno fuera basado en tres conjuntos de características: potencia "Pre-ABO", potencia "Pre-GBO" y la combinación de "Pre-ABO" ”Y poderes de“ Pre-GBO ”(“ Pre-ABO + Pre-GBO ”) (ver Huang et al. [2013] para detalles técnicos de la predicción del dolor). Por lo tanto, se obtuvo precisión de predicción para cada sujeto y cada conjunto de características. Se utilizó ANOVA unidireccional de medidas repetidas para comparar las precisiones de predicción de los tres conjuntos de características de preestímulo diferentes. Cuando el efecto principal fue significativo, se realizaron comparaciones por pares post-hoc de Tukey.

Experimento FMRI

Participantes

Los datos de IRMF se obtuvieron de 32 voluntarios sanos (20 mujeres) de 22,1 ± 2,0 años (media ± DE, rango = 19-24 años). Todos los voluntarios dieron su consentimiento informado por escrito y se les pagó por su participación. El comité de ética local aprobó los procedimientos experimentales.

Diseño experimental

Entregamos 10 pulsos de láser en cada una de las cuatro intensidades de estímulo (E1-E4), para un total de 40 pulsos, utilizando un intervalo entre estímulos aleatorio y variable entre 27 y 33 s (distribución rectangular). El orden de las intensidades de los estímulos fue pseudoaleatorizado. Se indicó a los sujetos que movieran un control deslizante para evaluar la intensidad de la sensación dolorosa provocada por el pulso láser 15-18 s después de cada estímulo, utilizando una EVA electrónica 0-10 (el ancla izquierda era "sin dolor" y la derecha era " dolor tan fuerte como podría ser ”). Al final de cada prueba, el control deslizante regresó automáticamente al punto medio (VAS = 5). La intensidad del dolor a diferentes energías de estímulo se comparó utilizando un ANOVA de medidas repetidas unidireccional. Cuando el efecto principal fue significativo, se realizaron comparaciones por pares post-hoc de Tukey.

Grabación de FMRI

Los datos de resonancia magnética funcional se adquirieron utilizando un escáner Siemens 3.0 T Trio con una bobina de cabeza estándar en el Laboratorio Clave de Cognición y Personalidad (Ministerio de Educación) de la Universidad Southwest (China). Para la exploración funcional se utilizó una secuencia de imágenes ecoplanares con eco de gradiente de todo el cerebro con un tiempo de repetición (TR) de 1.500 ms (tiempo de eco de 29 ms, 25 cortes de 5,0 mm de grosor con espacios entre cortes de 0,5 mm, 3 × Resolución en plano de 3 mm, campo de visión 192 × 192 mm, ángulo de giro de matriz 64 × 64 = 90 °). Se adquirió una imagen estructural ponderada en T1 de alta resolución (MPRAGE de vóxel isotrópico de 1 mm 3) después de la obtención de imágenes funcionales.

Análisis de datos FMRI

Preprocesamiento de datos FMRI

Los datos de fMRI fueron preprocesados ​​y analizados usando SPM8 (Wellcome Trust Centre for Neuroimaging, Londres, Reino Unido). Los primeros cinco volúmenes se descartaron para permitir el equilibrio de la señal. Las imágenes se corrigieron para determinar el tiempo de corte y el movimiento de la cabeza. Las imágenes resultantes se normalizaron al espacio del Instituto Neurológico de Montreal (MNI) [Ashburner y Friston, 2005], se suavizaron espacialmente con un núcleo gaussiano de 8 mm de ancho completo a la mitad del máximo (FWHM = 8 mm), y se filtraron temporalmente con un filtro de paso con frecuencia de corte de 1/128 Hz.

Análisis de modelo lineal general

Los datos de resonancia magnética funcional de un solo sujeto se analizaron vóxel por vóxel, utilizando un enfoque de modelo lineal general (GLM) [Frackowiak et al., 2004]. Para cada energía de estímulo, las respuestas BOLD se modelaron como una serie de eventos (pulsos de láser) utilizando una función de barra, que luego se convolucionó con una función de respuesta hemodinámica canónica (HRF) [Downar et al., 2003]. Los análisis estadísticos a nivel de grupo se llevaron a cabo utilizando un análisis de efectos aleatorios con una muestra t-prueba, como se implementó en SPM8. El umbral de significación se estableció como PFWE & lt 0,05 a nivel de grupo en los análisis exploratorios de todo el cerebro [Bennett et al., 2009].

Análisis PLS

De manera similar al análisis de datos de EEG, tanto las señales BOLD de todo el cerebro como la intensidad del dolor en cada energía de estímulo se normalizaron restando sus respectivas medias y dividiendo sus desviaciones estándar, para minimizar el efecto de la intensidad del estímulo en la evaluación de su prueba de -relación de ensayo para cada sujeto. La relación entre la señal BOLD normalizada al inicio del estímulo (que, debido al desfase temporal de la respuesta hemodinámica, refleja la actividad cerebral del preestímulo) y la intensidad del dolor se modeló mediante MVLR y se estimó mediante el análisis PLS. La importancia de estos coeficientes del modelo, que reflejaban el efecto de la actividad cerebral prestimulus en cada vóxel para predecir la intensidad del dolor subjetivo, se evaluó utilizando una muestra t-prueba contra cero, combinada con pruebas de permutación no paramétricas basadas en clústeres. Este análisis arrojó agrupaciones significativas de regiones cerebrales, dentro de las cuales la actividad cerebral prestimulus era predictiva de la intensidad subjetiva del dolor provocado por el próximo estímulo [Nichols y Holmes, 2002].

Independencia de las características de prestimulus BOLD

Para evaluar estadísticamente la independencia fisiológica de las señales de prestimulus BOLD que modulaban positiva y negativamente la intensidad del dolor ("Pos-BOLD" y "Neg-BOLD"), probamos si la combinación de ambas características podría mejorar significativamente la precisión de predicción de la intensidad del dolor, en comparación con cualquiera de las funciones por separado. Las señales de inicio "Pos-BOLD" y "Neg-BOLD" se midieron respectivamente a partir de los vóxeles que modulaban positiva y negativamente la intensidad del dolor para cada ensayo, y la intensidad del dolor se normalizó restando la media y dividiendo la desviación estándar en cada nivel de intensidad del estímulo para eliminar la influencia sistemática de la intensidad del estímulo en la intensidad del dolor. Los ensayos con una intensidad de dolor normalizada inferior y superior a 0 se definieron respectivamente como ensayos de dolor alto y bajo. La predicción del dolor se logró utilizando el clasificador SVM con validación cruzada de dejar uno fuera basado en tres conjuntos de características: señal de inicio "Pos-BOLD", señal de inicio "Neg-BOLD" y su combinación ("Pos-BOLD + Neg- NEGRITA"). La precisión de la predicción se obtuvo para cada sujeto y cada conjunto de características. Se utilizó un ANOVA unidireccional de medidas repetidas para comparar la precisión de la predicción de los tres conjuntos de características diferentes. Cuando el efecto principal fue significativo, se realizaron comparaciones por pares post-hoc de Tukey.


Opciones de acceso

Nos gustaría agradecer al editor asociado y a tres revisores anónimos por ayudarnos a mejorar enormemente este manuscrito. También nos gustaría agradecer al público en la Reunión Anual de Fonología de 2015, la Reunión Anual de LSA 2016 y la Conferencia de Fonología de América del Norte de 2016, así como al grupo de Fonología / Fonética de la Universidad Estatal de Michigan por sus útiles discusiones. Muchas gracias a Mina Hirzel por registrar los estímulos utilizados en nuestros experimentos. Además, nos gustaría agradecer a Russ Werner y Mike Kramizeh de la Universidad Estatal de Michigan por su ayuda con asuntos técnicos. Adam Liter recibió el apoyo del premio NSF NRT DGE-1449815 durante partes de la redacción y revisión de este documento. Los autores han contribuido igualmente a este artículo y comparten la primera autoría.


MÉTODOS

A continuación, describimos la arquitectura del modelo. El algoritmo de aprendizaje se describe en el Apéndice.

Arquitectura del modelo

The model architecture is shown in Figure 1. It takes the form of an actor–critic architecture, in which the critic is key for reward and feedback-based learning and the actor is key for stimulus and action selection learning. The critic and the actor influence each other in that the critic sends a teaching signal to the actor to strengthen or weaken stimulus and action selection learning (see equations in the Appendix). The critic is not informed about what action the actor has selected, but it is informed about whether the action made had rewarding consequences. The model is trained using the temporal difference (TD) model. We describe details of the TD model in the Appendix.

A schematic figure of the model showing relevant brain structures. The model has four modules: input, PFC, motor response, and dopamine module. The critic corresponds to dopamine neurons, whereas the actor corresponds to the prefrontal–striatal system. Learning (i.e., synaptic modification) takes place in both PFC and striatum modules. Learning is modulated by dopamine phasic responses projected from the dopamine module. The input layer sends topographic projections to the PFC layer. The PFC layer is fully connected to the striatum (motor) layer (i.e., every PFC unit is connected to every striatal unit). Activation of a unit in the input layer represents input received from the environment activation of a unit in the PFC layer represents attended-to stimuli activation of a unit in the striatum module represents a selected motor response. Dotted lines represent dopaminergic modulatory effects.

A schematic figure of the model showing relevant brain structures. The model has four modules: input, PFC, motor response, and dopamine module. The critic corresponds to dopamine neurons, whereas the actor corresponds to the prefrontal–striatal system. Learning (i.e., synaptic modification) takes place in both PFC and striatum modules. Learning is modulated by dopamine phasic responses projected from the dopamine module. The input layer sends topographic projections to the PFC layer. The PFC layer is fully connected to the striatum (motor) layer (i.e., every PFC unit is connected to every striatal unit). Activation of a unit in the input layer represents input received from the environment activation of a unit in the PFC layer represents attended-to stimuli activation of a unit in the striatum module represents a selected motor response. Dotted lines represent dopaminergic modulatory effects.

The model has four modules: input, PFC, motor response, and dopamine module (see Figure 1). The PFC layer is fully connected to the motor response layer (striatum module). Each unit in the input module represents a cue presented to the network. The input and PFC modules have the same number of nodes. The motor module has three nodes, each representing a different motor response. It is important to note here that although there is regional specificity in PFC and the basal ganglia, for the sake of simplicity, we are treating each of these structures in the model as a single module. Input patterns presented to the network activate their corresponding units in the input module. The input module sends topographic projects to the PFC layer (see Figure 2). Here, we use a winner-take-all network to simulate inhibitory connectivity among PFC neurons (see Appendix below for more information on this). At the cognitive level, the winning node represents the attended-to cue. For simplicity, in the current simulations, we allow only one PFC node to be active at each time step. Here, we argue that competitive dynamics among PFC neurons is the brain mechanism underlying limited attentional (as well as WM) processes. Like the Amos (2000) model, we also assume that a negative feedback decreases the activity of most active PFC neurons. As mentioned above, we assume that an increase in tonic dopamine levels increases activity and competition among PFC neurons, which, in turn, enhance selecting different stimuli following negative feedback.

A schematic figure of the model showing functions of different modules. The model uses an extended actor–critic architecture in which the critic is responsible for reward-prediction learning and the actor is responsible for action and stimulus selection learning (compare to Figure 1). Like Figure 1, activation of a unit in the input layer represents input received from the environment activation of a unit in the attentional layer (which is a simulation of PFC) represents attended-to stimuli activation of a unit in the motor module (which is a simulation of the striatum) represents selected motor response. In the model, the number of attentional weights is equal to the number of input nodes—each input node has a corresponding attentional weight. In this example, a filled node means it is active (and an unfilled node means it is inactive). In this example, Cue 1 and Cue 3 are presented to the model (see activation of nodes in the input module). The model is paying attention to Dimension 3 (see attentional module) and selects motor response, a motor response represented by the middle node in the motor module. Teaching signal corresponds to dopamine phasic signals coming from the ventral tegmental area and substantia nigra pars compacta.

A schematic figure of the model showing functions of different modules. The model uses an extended actor–critic architecture in which the critic is responsible for reward-prediction learning and the actor is responsible for action and stimulus selection learning (compare to Figure 1). Like Figure 1, activation of a unit in the input layer represents input received from the environment activation of a unit in the attentional layer (which is a simulation of PFC) represents attended-to stimuli activation of a unit in the motor module (which is a simulation of the striatum) represents selected motor response. In the model, the number of attentional weights is equal to the number of input nodes—each input node has a corresponding attentional weight. In this example, a filled node means it is active (and an unfilled node means it is inactive). In this example, Cue 1 and Cue 3 are presented to the model (see activation of nodes in the input module). The model is paying attention to Dimension 3 (see attentional module) and selects motor response, a motor response represented by the middle node in the motor module. Teaching signal corresponds to dopamine phasic signals coming from the ventral tegmental area and substantia nigra pars compacta.

The model has four parameters that are manipulated depending on the simulation of PD and dopaminergic medications. These parameters are two learning rate parameters (one each for the striatal and PFC modules) and two gain parameters (striatal and PFC modules). Learning rate parameters simulate changes in phasic dopamine signaling (see, for example, Shohamy, Myers, Kalanithi, & Gluck, 2008 for experimental support, see Reynolds, Hyland, & Wickens, 2001), whereas gain parameters simulate changes in tonic dopamine levels in the corresponding simulated brain structure (Servan-Schreiber, Cohen, & Steingard, 1996 Cohen & Servan-Schreiber, 1992 see Appendix for a description of all parameters). We simulate PD by decreasing learning rate and gain values in the basal ganglia and PFC. We simulate the effects of dopaminergic medication by increasing gain values while concurrently decreasing learning rate values, beyond those used for healthy participants (Table 1).

Parameter Values Used in the Simulations

LR = learning rate G = gain BG = basal ganglia PFC = prefrontal cortex. See Appendix for description of all parameters.

The simulated striatum in the proposed model learns to map input stimuli to responses (for similar ideas, see Guthrie et al., 2009 Suri & Schultz, 1999). Like the PFC module, we use a winner-take-all network to simulate inhibitory connectivity among simulated striatal neurons. At the cognitive level, the winning node represents the selected motor response (for similar ideas, see Guthrie et al., 2009 Suri & Schultz, 1999). Unlike most existing basal ganglia models (Ashby, Ell, Valentin, & Casale, 2005 Frank, 2005 Suri & Schultz, 1999 Houk, 1995), the basal ganglia, in our model, learns to map representations of attended-to stimuli to motor responses. These mechanisms, as discussed below, can explain performance in various multiple-cue category learning tasks.

Based on experimental findings (Silberstein et al., 2005 Kaasinen et al., 2001 Carey et al., 1995), it is likely that dopaminergic medications increase dopamine levels in PFC. Specifically, we simulate an increase in PFC tonic dopamine levels by increasing the gain value of the sigmoidal activation function, as previously proposed by various computational models (Amos, 2000 Cohen & Servan-Schreiber, 1992). This, in turn, increases the signal-to-noise ratio in PFC neurons, which has important implications for attentional learning processes: Increasing the gain value causes the sigmoidal function to decrease the difference between inputs. For example, the difference in the activation level given input of 0.7 versus 0.8 decreases as the gain value increases that is, for a large gain value, the sigmoidal activation function de-emphasizes differences in input values (within a certain range). In other words, increasing the gain value increases the competitive dynamics in PFC and the likelihood to shift to a new dimension. This has implications for learning multiple-cue category learning tasks, as described below.


Ver el vídeo: ML-32 Presentacion del problema de selección del modelo óptimo (Junio 2022).