1 Este paper fue presentado en el II Coloquio Latinoamericano de Analistas del Discurso, La Plata y Buenos Aires del 25 al 29 de Agosto de 1997.
2 Lic. en Antropología - U.N.L.P.
El objeto de este trabajo es exponer las ventajas y limitaciones que presenta la utilización de software diseñado para asistir el análisis de datos cualitativos (básicamente texto) sobre programas de propósito general, en el análisis de discursos producidos en el marco de la investigación "La construcción del concepto de pobreza. Estudio de su intertextualidad en la relación asistente - asistido".
Para una mayor claridad en la exposición comenzaremos describiendo brevemente la investigación y la metodología utilizada a fin de que se pueda valorar mejor el aporte del programa.
Objeto de investigación y marco teórico
El objeto de nuestra investigación es el concepto de pobreza como objeto semiótico socialmente construido tal como aparece en el discurso de sujetos asistidos por programas sociales y en el de quienes los asisten.
Este trabajo involucra el estudio de procesos sociales de producción, circulación e interpretación de la significación. No obstante no es un estudio básicamente lingüístico o semiótico sino un estudio antropológico sobre la producción social de cierta significación, que utiliza técnicas de análisis semiótico del discurso y que se vale de la semiótica cognitiva "como metodología de base para las ciencias sociales" (Magariños de Morentín, 1990), en consideración a una caracterización de los fenómenos sociales como significativos en tanto están interpretados.
Las estrategias metodológicas utilizadas son la Etnometodología y la semiótica de enunciados propuesta por Magariños de Morentín (1994), deudora de la concepción pierceana del signo.
La conjugación del esquema pierceano con los aportes de las investigaciones cognitivas nos permiten comprender que el "objeto" en cuestión no es el referente de Frege ó la ding an sich kantiana como lo ha entendido tradicionalmente el positivismo, sino un objeto significante, interpretado, y, en este sentido, un objeto semiótico, construido en el discurso, producido por el lenguaje; no es el objeto material sino "[...] el mundo tal como lo construye, para alguien, alguna (ó cada una ) de las interpretaciones vigentes, en determinado momento y comunidad (ó sector, todo lo acotado que se desee, de tal comunidad)" (Magariños de Morentín, 1994: 4).
No puede percibirse "el mundo verdadero tal como es". porque el input perceptual es organizado junto a un plus de información previa de un modo tal que el resultado "se experimenta no como parte del acto de pensar sino como parte del entorno". Ray Jackendorff (1983) denomina mundo real a la fuente del input y mundo proyectado al mundo experimentado, aunque éste último sería el verdadero mundo real en el sentido de que es el único al cual tenemos acceso, el único que puede ser percibido, ó incluso pensado. Toda percepción es una percepción interpretada; "toda realidad es una semiosis" (Magariños de Morentín, 1983: 11).
En este trabajo, siguiendo a Magariños de Morentín (idem pag. VI) entenderemos por significación "la relación diferencial que vincula a un determinado objeto semiótico con el resto del universo del conocimiento y con el conocimiento de su propia historia". Y sostendremos que las significaciones se producen en el discurso y no a nivel de la lengua. El estudio de un texto (ya se trate de un documento ó de la desgrabación de una entrevista) desde el punto de vista lingüístico nos conduce a la identificación de frases entre las que existen relaciones gramaticales. El estudio del mismo texto desde el punto de vista lógico nos llevará a considerarlo como un sistema deductivo formado por proposiciones entre las que interesa conocer sus relaciones lógicas de derivación. Pero el estudio de dicho texto como discurso requiere que se reconozcan los enunciados que lo constituyen y cómo se agrupan en formaciones discursivas.(M. Foucault, 1991:194-197). Los enunciados son, por tanto, la "materia prima semiótica" sobre la que se aplica las operaciones cognitivas.
Metodológicamente la identificación de estas formaciones discursivas pasa por la construcción de los mundos semióticos posibles, con lo cual el discurso resulta ser el "producto textual de las operaciones cognitivas socialmente adquiridas por determinado emisor, en el cual y con las cuales se construyen los significados del mundo semiótico posible para ese determinado emisor" (Magariños de Morentín, 1993:36).
La noción de mundos posibles proviene de la Lógica modal, y la especificación de su carácter semiótico en el contexto de la metodología ya mencionada permite entenderlos como "el conjunto de relaciones de accesibilidad que pueden identificarse al relacionar un texto, sus interpretaciones vigentes en determinado momento histórico de determinada sociedad y el conjunto de referentes construídos para cada una de tales interpretaciones" (Magariños de Morentín, 1995:6) y aplicarlos a "la representación de toda estructura sintáctica mínima (en cualquiera de las semiosis posibles: icónica, indicial ó simbólica) constituida por la relación triádica que asocia dos functores mediante un determinado conector, así como, si las hubiere, por las modalizaciones que reciba cada uno de tales functores y el conector, conservando siempre la estructura sintáctica mínima inicial. Se corresponde operacionalmente con las denominadas 'definiciones contextuales' y, por tanto, con su representación cognitiva, las 'redes'". (idem 1994: 2).
Las mencionadas relaciones de accesibilidad se refieren a las operaciones cognitivas que permiten decidir, a partir del enunciado de base, qué expresiones pueden ser reconducidas a él en virtud de que contienen formas que pueden ser consideradas consecuentes de otras formas antecedentes contenidas en dicho enunciado de base. Mundos posibles accesibles entre sí pertenecen a la misma formación discursiva.El método y las técnicas han sido desarrolladas y expuestas en detalle por Magariños de Morentín (1996). Para el propósito del presente trabajo nos basta con señalar que operativamente, los pasos del análisis son:
2) Reducción de los textos de base y de las entrevistas a definiciones contextuales y elaboración de un archivo - base de datos. Mediante un programa de búsqueda textual, rastreo en la base de datos de los términos a definir, con su contexto, de acuerdo con el criterio del mínimo sintáctico y semántico. Aunque la situación ideal sería la de un "barrido" exhaustivo en el que para cada lexema utilizado se buscaran sus definiciones contextuales, la dimensión de esta tarea hace que sea prácticamente irrealizable. Por otra parte, una selección de ciertos términos con preferencia sobre otros introduciría un sesgo ideológico en la investigación. Por este motivo se sugiere el criterio intermedio de normalizar todos los sustantivos y sus modalizadores.
3) Agrupación todas las definiciones contextuales de un mismo término.
4) Identificación abductiva de los enunciados de base y formación de un archivo de enunciados.
5) Identificación de las relaciones de accesibilidad entre los mundos semióticos posibles delimitados en el análisis y definición de las formaciones discursivas.
Como nuestro estudio enfoca el concepto de pobreza se decidió incluir en la base de datos todas las definiciones contextuales de los lexemas pobre, pobreza y otros presuntamente pertenecientes al mismo campo semántico con sus correspondientes modalizaciones, efectivamente utilizados por los entrevistados para referirse a los asistidos por programas sociales.
En el diseño de la base, cada definición contextual constituiría un registro y estaría conformado en principio por campos para lexema y definición y campos adicionales para las categorías demográficas relevantes mediante las que se clasificaría a los emisores que de acuerdo a las hipótesis iniciales: condición de asistente o asistido, organización para la cual se asiste o por la cual se es asistido y secundariamente edad y sexo.
Apenas comenzada la tarea de ingreso de los enunciados en la base de datos se hizo evidente que este proceso demandaría un tiempo tal vez mayor que el del propio análisis por lo que se decidió comparar la performance del administrador de base de datos de propósito general con la de un programa especializado en el procesamiento de datos cualitativos que, si bien no ha sido desarrollado específicamente para análisis de discurso ofrece importantes ventajas sobre los programas de propósito general utilizados en primera instancia.
Hasta donde sabemos ésta es una de las primeras investigaciones que utiliza este programa con este enfoque metodológico, por lo que pude resultar de interés para otros investigadores que estén considerando el uso de software especializado en este tipo de estudios.
El NUD*IST
El NUD*IST pertenece a lo que se ha denominado "programas basados en un sistema de indexación" o de categorías. La sigla, de connotaciones eróticas, significa Non-numerical, Unstructured Data Indexing, Searching and Theoryzing (indexación, búsqueda y teorización de y sobre datos no numéricos y no estructurados) . Diseñado por informáticos e investigadores sociales bajo el enfoque conocido como Grounded Theory Methodology (Glaser y Srtrauss, 1967; Strauss y Corbin, 1992) para facilitar el desarrollo de teorías en base a datos empíricos, sus desarrolladores lo describen como un sistema híbrido, resultante de la combinación de un sistema de documentos consistente en una base de datos textuales que integra un poderoso motor de búsqueda con un sistema de indexación "[...] diseñado para permitir al usuario crear y manipular conceptos y almacenar y explorar ideas emergentes".
El sistema genera automáticamente y en pocos minutos una base de datos no estructurada y muy flexible a partir de documentos en línea preformateados por el investigador. Si bien existe un procedimiento para trabajar con documentos no-en-linea éstos últimos no han sido usados en esta investigación. La preparación de los documentos consiste en segmentar el texto en las unidades mínimas que serán el objeto de las búsquedas. Estas pueden ser palabras, oraciones, párrafos o grupos de párrafos a elección del analista según convenga a la investigación. En nuestro caso utilizamos como unidades mínimas los enunciados representados por las definiciones contextuales.
A través de un potente motor de búsquedas de cadenas de caracteres y de patrones textuales definidos por el investigador mediante una gran variedad de comodines y de operadores lógicos en combinaciones muy complejas como para detallarlas aquí , el sistema recupera las unidades textuales que satisfacen las condiciones especificadas y puede indexar automáticamente los resultados, asignándoles un rótulo indicativo del tema de que tratan o de la categoría de análisis baja la cual el analista deseará recuperarlas. Estas categorías, denominadas "nodos" en el programa equivalen a los campos de una base de datos. Pueden ser organizados en una jerarquía arborescente que constituye el esqueleto del "index system" y constituyen un sistema clasificatorio que es al mismo tiempo un esquema conceptual de la investigación.
Cada nodo puede almacenar referencias a documentos completos, a fragmentos de uno varios documentos, resultados de búsquedas textuales o de consultas del sistema de índices, la definición del concepto que el nodo representa o una descripción de su contenido y memos de formato libre donde se pueden registrar todo tipo de comentarios y reflexiones sobre el nodo y su contenido. También pueden adosarse memos a los documentos individualmente.
Nosotros hemos definido dos tipos de nodos: unos de tipo "conceptual" donde se indexan las definiciones contextuales de los lexemas relevantes para el estudio y otros de tipo "demográfico" donde se guarda la totalidad del texto correspondiente a cada emisor de acuerdo a las variables ya mencionadas.
Un rasgo del programa, importante en los estudios cualitativos es su flexibilidad: los nodos individualmente o ramas enteras pueden ser trasladados fácilmente dentro del árbol. Pueden ser fusionados, copiados, subdivididos y eliminados sin riesgo de perder la información original, porque el texto no es manipulado directamente sino sólo las direcciones de las unidades textuales indexadas.
Otra característica importante del programa, denominada por sus diseñadores system closure, es su posibilidad de retroalimentarse permitiendo que los resultados de las búsquedas y consultas de todo tipo (el output del sistema) sean ingresados como documentos y así ser a su vez objeto de búsquedas, indexados, comentados y consultados como todos los demás documentos. Esta función, sin embargo no ha sido utilizada en esta investigación.
Todas las tareas que se realicen rutinariamente pueden ser automatizadas a fin de que el sistema las efectúe tras la indicación de un sólo comando, al estilo de los archivos batch del DOS o de las macros de otros programas. Esta facilidad se ha aprovechado para ingresar varios documentos en una sola operación.
NUD· IST también puede generar automáticamente matrices cualitativas similares a las obtenidas por el cruce de variables. Ello resulta muy útil si definimos nodos para cada variable demográfica y nodos "hijos" (así se llaman) para cada uno de los valores que toman estas variables. Por ejemplo, si tenemos un nodo denominado "religión" con los nodos "católico", "pentecostal" y "mormón", como hijos en los cuales hemos indexado los textos completos de las entrevistas realizadas a católicos, pentecostales y mormones, respectivamente; y tenemos otro nodo denominado "pobreza" como ancestro de los nodos "pobreza material" y "pobreza espiritual", en los cuales hemos indexado las búsquedas textuales de dichos lexemas efectuadas sobre todas las entrevistas, entonces podemos pedir al programa que realice la intersección (cruce) de los nodos "religión" y "pobreza", obteniendo como salida una matriz de doble entrada que tendrá en las filas todos los valores de una de las variable y en las columnas todos los valores de la otra variable, y mostrará en las intersecciones las direcciones de las unidades textuales (párrafos u otra unidad que hayamos definido) en los que coocurren los valores indicados de cada variable.
|
|
|
|||
|
|
|
|
||
| Pobreza | pobreza material | |||
| pobreza espiritual | ||||
Esta matriz puede ser ingresada como un documento, indexada, consultada y editada. Pero también podemos utilizarla para cruzar con ella una tercera variable. Con esta nueva matriz podemos realizar las mismas operaciones que con la primera salvo volver a cruzarla con otra variable.
Esta facilidad nos permite monitorear la saturación relativa de las categorías, complejizar las tipologías y contabilizar las frecuencias de casos presentes en las intersecciones como para elaborar cuadros estadísticos con los que efectuar algunas pruebas cuantitativas. También permite hacernos algunas preguntas que orientarán no sólo nuestro análisis sino también la recolección de nuevos datos. Por ej. si la intersección de "pobreza espiritual" y "Pentecostal" aparece vacía ¿Se deberá esto a que los pentecostales no utilizan este lexema, o será necesario realizar más entrevistas a pentecostales para poder confirmar si está vigente o no en este grupo religioso? ¿O tal vez no hemos formulado explícitamente la pregunta en las entrevistas realizadas?
Ventajas
Consideramos que la utilización del programa ha sido positiva para nuestro estudio agilizando las tareas con el consiguiente ahorro de tiempo, contribuyendo al logro de una mayor rigurosidad, exhaustividad, transparencia y confiabilidad, y facilitando la exploración y el testeo de hipótesis.
Limitaciones y desventajas
Entre los aspectos negativos podemos señalar las limitaciones y las desventajas. Con las primeras nos referimos a aquello que el programa no hace pero que podría hacer, a las modificaciones que se le podrían efectuar para volverlo más amigable con el usuario o para facilitar aún más el trabajo; y con las últimas designamos a aquellos problemas o inconvenientes derivados del uso del software, que no se presentarían en un análisis manual.
Limitaciones:
En términos generales coincidimos con la evaluación de Richards y Richards (1993):
"Software extending some sorts of methods risks restricting research imaginations. Software offering new methods of constructing, exploring and testing theory risks reifying particular approches to theorizing. We need more support for playfull exploration of possibilities of data and discovery of surprising themes. The only thing that is certain is that we will not return to a pre-computer methodology."
Bibliografía
Foucault, Michel (1991): La arqueología del saber. Ed.. Siglo XXI. 15º de., México.
Glaser, Barney y Anselm Strauss (1967): The discovery of grounded theory: strategies for qualitative research. Aldine Publishing Company, N.Y.
Jackendorff, Ray (1983): Semantics and cognition. Cambridge. MIT press.
Lee, R.M. y Niegel G. Fielding (1991): "Computing for qualitative research: Options, problems and potential". In: Fielding y Lee (1991).
Magariños de Morentín, Juan Angel (1983) El signo. De. Hachette, Bs. As.
Magariños de Morentín, Juan Angel (1993): La semiótica de enunciados. I.I.C.S., Investigación 10, U.N.L.P., La Plata.
Magariños de Morentín, Juan Angel (1994): "Hacia un concepto estricto de Mundos semióticos posibles". In: VI Congreso internacional de la asociación española de semiótica "Mundos de ficción", Murcia.
Magariños de Morentín, Juan Angel (1996): Los fundamentos lógicos de la semiótica y su práctica. Ed. EDICIAL, Bs. As.
Magariños de Morentín, Juan Angel y col. (1993): Análisis semiótico del discurso político. I.I.C.S. La Plata.
Magariños de Morentín, Juan Angel y col.(1990): Esbozo semiótico para una metodología de base de las Ciencias Sociales. I.I.C.S. Investigación 6. La Plata
Maingueneau, Dominique (1980): Introducción a los métodos de análisis del discurso. De. Hachette. Bs. As.
Ontoria, A. et al. (1995): Mapas conceptuales. Una técnica para aprender. Ed. Narcea S.A., Madrid.
Prothero, Andrea (1996): "Nud*ist - Aiding or abetting qualitative marketing research?" Available: WWW, URL: http://qsr.latrobe.edu.au/Nudist-software/papers.htm Accedido: 29/3/97.
Richards, Thomas J. y Lyn Richards (1991): "The transformation of qualitative method: computational paradigms and research processes". In: Fielding y Lee (1991).
Richards, Thomas J. y Lyn Richards (1992): "Using computers in qualitative research". In: Methods of collecting and analyzing empirical materials, Cap. 28, pp. 445 - 462.
Rodriguez, P. Gustavo (1997a): "Fundamentos de análisis de datos cualitativos para el desarrollo de software para ciencias sociales". V Congreso Argentino de Antropología Social, La Plata.
Rodriguez, P. Gustavo (1997b): "El recurso informático en el procesamiento de datos cualitativos en ciencias sociales". V Congreso Argentino de Antropología Social.
Strauss, Anselm y Juliet Corbin (1992): "Grounded theory methodology". In: Strategies of inquiry, Cap. 17, pp 273-285.
| Regreso a Home Page |