Informe APEI sobre usabilidad

Hassan Montero, Yusef; Ortega Santamaría, Sergio

2. El factor humano

2.1. Percepción visual

El canal visual es el sentido más intensamente utilizado en nuestra vida cotidiana y, como no podía ser de otra forma, en el uso de aplicaciones interactivas. Si definimos la interfaz como la superficie de encuentro entre usuarios y aplicación, debemos entender que su diseño gráfico será el que condicione, desde el primer contacto, la fluidez interactiva entre ambos, la usabilidad de la aplicación y la consecuente experiencia del usuario.

Dado que el diseño centrado en el usuario requiere conocer al usuario - sus necesidades, habilidades, contexto, entorno, objetivos y motivaciones -, el diseño de interfaces gráficas exige conocer “los ojos del usuario”, o más correctamente, cómo las personas percibimos visualmente (Hassan-Montero; 2007b).

Muchas de las cuestiones que plantearemos pueden resultar obvias para el lector, desde el mismo momento en que si analizamos subjetivamente la apariencia de una interfaz, podemos intuir su eficacia visual. Sin embargo, con este método sólo “vemos” el resultado de nuestra percepción, pero no entendemos su proceso, el porqué. ¿Qué sucede desde el impacto de la luz en la retina del ojo hasta que asignamos significado e interiorizamos aquello que estamos viendo?

Vemos menos de lo que creemos ver, pero más de lo que somos conscientes de estar viendo

Las personas estamos condenadas a realizar diariamente miles de búsquedas visuales. Por supuesto podremos cerrar los ojos cuando nos plazca, o “paralizar” la vista en un punto “perdido”, aunque mantener esta supresión visual requerirá un esfuerzo, ya que estamos programados biológicamente para no cesar en nuestra búsqueda visual.

Es el movimiento o rotación ocular el mecanismo que sustenta estas búsquedas visuales. Este movimiento ocular se produce mediante saltos rápidos - llamados “sacadas”- que se intercalan con fijaciones, o momentos de relativa quietud del ojo que nos permiten enfocar y ver nítidamente una zona determinada (Jacob; 1995).

Como metáfora podemos decir que lo que estamos haciendo es tomar instantáneas continuamente, como si de una cámara fotográfica se tratase, cuya resolución estará determinada por el punto en que realicemos la fijación. Mientras que esa zona focal será capturada con una gran resolución o nitidez, aquellas zonas no enfocadas pero dentro de nuestro campo de visión se capturarán con una resolución inversamente proporcional a su distancia con la zona central (Ware; 2008). Las zonas más alejadas del punto focal conformarían lo que llamamos visión periférica.

Como primera curiosidad sobre nuestra forma de ver, resulta que si bien durante las fijaciones capturamos incesantemente instantáneas de la escena visual, durante los movimientos “sacádicos” -30 a 120ms-, la visión queda prácticamente suprimida (para una explicación más detallada véase Hassan-Montero y Herrero-Solana, 2007). Sin embargo, estas interrupciones no son percibidas, lo que indica que lo que vemos es una construcción mental a partir de las instantáneas percibidas. Es decir, vemos menos de lo que creemos ver.

Al mismo tiempo, la información visual que adquirimos con las fijaciones es procesada masiva y paralelamente (Wolfe; 2006) (Ware; 2008). Si toda esta información llegara a nuestra consciencia seguramente sufriríamos un colapso cognitivo, ya que como veremos en el siguiente capítulo estamos biológicamente limitados en cuanto al volumen de información que podemos procesar conscientemente.

Para evitar este colapso las personas estamos dotadas de mecanismos perceptuales automáticos, en forma de filtros, que sólo permiten llegar una parte de la información percibida a nuestra consciencia. En otras palabras, vemos más de lo que somos conscientes de estar viendo. El primero de esos filtros es el de nuestra atención visual.

Atención visual: Un mecanismo doblemente guiado

¿Qué determina que atendamos visualmente una zona y no otra de una interfaz? Para responder a esta cuestión primero debemos entender que, en los primeros instantes de la percepción visual, la información fluye masivamente en forma de características básicas: color, movimiento, orientación, tamaño, etc. (Wolfe; 2006).

La percepción no es un proceso pasivo, pues las personas guiamos voluntaria y activamente nuestra atención, decidiendo qué queremos que supere el filtro de nuestra atención visual, y qué no. Este guiado se produce sobre características gráficas deseadas, es decir, sobre las propiedades básicas que resultan de nuestro interés (Wolfe; 2006). Por ejemplo, cuando leemos un texto en una web, son aquellas cualidades gráficas propias del alfabeto las que buscamos visualmente y a las que atendemos, y no otras.

Ahora bien, que nos encontremos en el desierto buscando una cantimplora, no significa que nuestra atención no se vaya a ver atraída involuntariamente hacia un escorpión en movimiento. Es decir, decidimos qué queremos atender visualmente, pero al mismo tiempo nuestra atención se ve interferida involuntariamente y de forma automática por determinadas características visuales, aún cuando hagan presencia en zonas de visión periférica.

En las interfaces web sucede exactamente igual. Los usuarios explorarán o escanearán visualmente la interfaz en busca de propiedades gráficas propias de los objetos deseados en cada momento – enlaces, texto, imágenes, controles… -. Esta exploración puede verse facilitada si el diseñador enfatiza aquellos elementos potencialmente más relevantes para los usuarios, guiando su atención y estableciendo "puntos de entrada" (Fidalgo; 2006); o por el contrario entorpecida si la interfaz no presenta una jerarquía visual lógica, es decir, cuando nada parece visualmente más relevante que el resto.

Los mecanismos de los que, como diseñadores, disponemos para atraer la atención del usuario, se encuentran en el uso que hagamos de las diferentes características gráficas básicas en la interfaz. Lo que nos dice la teoría psicológica sobre la percepción, es que la capacidad que tiene un elemento visual de atraer la atención del usuario se encuentra en directa relación con sus diferencias gráficas respecto a los elementos colindantes (Wolfe; 2006). Es decir, visualmente nos vemos involuntariamente atraídos por lo inusual.

Fig 2.1. Inevitablemente nuestra atención se ve guiada hacia el círculo rojo, el único inusual. Fuente: www.human-computer.net/blog

Un elemento con mayor tamaño que el resto, con un color distinto a los demás (figura 2.1), con una orientación diferente, o en movimiento (mientras el resto de la página permanece estática), tendrá más probabilidad de atraer nuestra atención (Wolfe, Horowitz; 2004). Esto es algo que comprendieron a la perfección los diseñadores de banners (movimiento+animación=atención visual), pero dado que la mayor parte de las veces no visitamos una web buscando contenidos de ese tipo, los usuarios aprendieron a ignorar automáticamente todo aquello que, por sus propiedades gráficas (y ubicación), pareciera información publicitaria (lo fuera o no). Esta "ceguera selectiva" no significa que los usuarios no vean los banners animados, sino que esa información visual en la mayoría de casos no llega a superar el filtro de su atención, y por tanto esas zonas de la interfaz no recibirán fijaciones.

La publicidad contextual, popularizada por Google, intenta atraer nuestra atención por el camino contrario. En vez de por medio de su diferenciación gráfica respecto al resto de elementos de la página, mediante su similitud, de tal forma que el usuario no aparte su atención, ya que tendrá la impresión de que por su aspecto pueda tratarse también de contenido de interés. Por supuesto, conforme mayor sea la experiencia de navegación del usuario, más mecanismos automáticos habrá interiorizado para administrar su atención visual, lo que le permitirá guiarla más eficazmente hacia lo que considere relevante.

Organización perceptual

Una vez que focalizamos nuestra atención sobre una zona de la interfaz, y antes de darle un sentido a lo que estamos viendo, tiene lugar una etapa de organización perceptual. Las características gráficas básicas que superan el filtro de nuestra atención se reconfiguran perceptualmente, formando patrones, estructuras, formas, contornos y regiones. Es decir, antes de interpretar la semántica o significado de lo que vemos, se produce un análisis automático de su sintaxis gráfica: cómo se coordinan, ordenan y vinculan entre sí los elementos foco de nuestra atención visual.

Dicho de otro modo, lo que tiene lugar es un proceso automático de resolución de interrogantes visuales: ¿Qué forma parte de qué? ¿Qué está relacionado con qué? ¿Qué sigue un orden lógico de qué?

En esta etapa es donde entran en juego las - tan populares en el campo del diseño gráfico- leyes de la Gestalt (véase wikipedia: Gestalt Psychology). Entre estas leyes, algunas de las que mayor aplicación tienen en el diseño de interfaces son la ley de proximidad, de similitud y de región común (Ware; 2003); todas ellas referidas a cómo un conjunto de elementos son percibidos automáticamente como un mismo grupo.

Sobre estas leyes se sustentan numerosas recomendaciones o directrices de usabilidad. Por ejemplo, cuando se recomienda que los enlaces tengan todos una misma caracterización gráfica (color, tipografía, efectos), se hace con el fin de que el usuario, una vez detectado un enlace, pueda diferenciar automáticamente y sin esfuerzo qué es un enlace y qué no dentro de un mismo sitio web, sobre la base de la ley de similitud.

Por su parte, la ley de proximidad o la de región común es ampliamente utilizada para, por ejemplo, codificar visualmente menús de navegación, agrupándolos como una misma cosa, y diferenciándolos del resto de elementos de la interfaz.

La verdadera utilidad de las leyes de la Gestalt es que, si son correctamente aplicadas, permiten al usuario realizar un gran número de operaciones visuales de forma exclusivamente automática, permitiéndole asignar sin esfuerzo funciones y significados similares a los elementos relacionados o agrupados. Lo que se encuentre próximo, dentro de un mismo marco, o sea gráficamente similar, tendrá un sentido similar.

Como se puede deducir, el mayor error que podemos cometer en relación con estas leyes es aplicarlas de forma que se opongan entre sí: que sobre la lógica de una ley dos elementos se encuentren relacionados, pero sobre la lógica de otra, pertenezcan a grupos diferentes.

Ver no es lo mismo que reconocer

La última de las etapas de la percepción visual es aquella en la que se vincula lo que se está viendo con lo conocido. En otras palabras, una vez que focalizamos nuestra atención visual, y organizamos perceptualmente la zona enfocada, intentamos interpretar, asignar significado o comprender aquello que estamos viendo. Aquí nos adentramos en el complejo dominio de la cognición humana: el lenguaje, la memoria, el razonamiento…

Aunque posteriormente trataremos el tema de la cognición y los modelos mentales, desde el punto de vista del diseño visual lo que debemos asegurar es que el tamaño y forma del objeto gráfico lo haga reconocible, que permita una fácil equiparación con aquello que el usuario conoce, puede comprender o interpretar (Hassan-Montero; 2007b). En el uso de texto, influirá el contraste y tamaño de la fuente, la tipografía y efectos empleados, pero por encima de todo, el uso del lenguaje, su claridad y precisión. En el caso de iconos o elementos de control el problema a resolver es similar, pues se debe prestar especial atención al uso de metáforas – y cómo son de familiares para el público objetivo -, la resolución gráfica de estos objetos, o su grado de estandarización.

No miramos del mismo modo una interfaz web que un atardecer

Hasta el momento hemos descrito el proceso de percepción visual desde una perspectiva casi exclusivamente universal. Sin embargo nuestra actitud y comportamiento visuales no son los mismos independientemente de la escena visual que tengamos delante de nuestros ojos. Nuestra experiencia adquirida navegando por Internet nos impregna de mecanismos y herramientas que nos permiten un comportamiento específico y optimizado para la exploración visual de interfaces web.

Sabemos que los diseñadores web atienden en mayor o menor medida a convenciones implícitas (Hassan-Montero; 2007b). Cuando un diseñador afronta la elaboración de una interfaz, antes habrá visitado miles de sitios web, y será consciente de que sus potenciales usuarios también tendrán una larga experiencia navegando por otros sitios web. Estas convenciones, desde el punto de vista exclusivamente gráfico, se refieren a propiedades gráficas comunes para representar elementos de control y navegación (enlaces, botones, scroll, menús...), pero también a la ubicación y distribución de los diferentes elementos de una página en función de su naturaleza. Como comentábamos previamente, los contenidos publicitarios suelen ocupar determinadas zonas de la página, pero lo mismo ocurre con los sistemas de navegación, el buscador, las secciones de contacto, el logo, y por supuesto, el contenido principal.

Esto provoca que los usuarios, en función de qué tipo de elemento persigan con cada búsqueda visual, atenderán con mayor probabilidad a aquellas áreas de la interfaz donde habitualmente se encuentran ubicados en la mayoría de sitios web. Por tanto, como diseñadores, debemos atenernos a estas convenciones de diseño web, con el objetivo de facilitar la eficiencia de cada una de las búsquedas visuales que realicen los usuarios.

Principios fundamentales de diseño visual

Como conclusión podemos afirmar que, si bien en el diseño de interfaces intervienen muchos más factores, la recomendación principal a la hora de afrontar el diseño de una interfaz visualmente usable es el cumplimiento sistemático de los siguientes principios: Enfatizar, Organizar y Hacer reconocible.

Fig. 2.2: Principios del diseño visual

Enfatizar implica hacer visible lo relevante, establecer una clara jerarquía visual entre elementos y zonas de la interfaz, de modo que la atención del usuario se vea guiada de forma lógica y secuencial de lo más relevante hacia lo secundario. La relevancia, claro está, es un concepto subjetivo, y no todos los usuarios considerarán relevante lo mismo. Además, como diseñadores debemos atender a los objetivos del propio sitio web (cliente), que no siempre coincidirán con los de sus usuarios. Nuestra misión es enfatizar aquellos elementos de la interfaz que para el cliente y la mayoría de usuarios pueden tener más importancia, y mantener un equilibrio entre los intereses del usuario y del cliente cuando no sean compatibles (por ejemplo, el necesario equilibrio entre contenido y publicidad).

Organizar significa establecer relaciones visuales lógicas, que faciliten de este modo al usuario relacionar o diferenciar elementos automáticamente. La correcta aplicación de las leyes de la Gestalt impregnará al diseño de un aspecto visual organizado, claro e intuitivo, lo que repercutirá positivamente tanto en su usabilidad objetiva como subjetiva.

"Hacer reconocible" nos obliga a considerar con especial cuidado el uso de iconos, etiquetas, encabezados, enlaces… de tal forma que se requiera del usuario el menor de los esfuerzos para comprender y predecir el funcionamiento interactivo de la interfaz, permitiéndole dedicar toda su capacidad de atención y concentración a lo que realmente le interesa, el contenido.

← Anterior Índice de Contenidos Siguiente →

Informe APEI de Usabilidad

Yusef Hassan Montero y
Sergio Ortega Santamaría

Índice de contenidos

0. Introducción

1. Definición y conceptos

1.1. La experiencia del usuario

1.2. Simplicidad

2. El factor humano

2.1. Percepción visual

2.2. Cognición

2.3. Modelos mentales

2.4. El sujeto como ser social

3. Diseño centrado en el usuario (DCU)

3.1. Introducción

3.2. Metodologías y técnicas de DCU

3.3. Documentación del diseño

4. Conclusiones

5. Bibliografía

Citación recomendada:

Hassan-Montero, Y.; Ortega-Santamaría, S. (2009). Informe APEI sobre Usabilidad. Gijón: Asociación Profesional de Especialistas en Información, 2009, 73pp. ISBN: 978-84-692-3782-3.