Actas del Congreso Nacional de Tecnología Aplicada a Ciencias de la Salud Vol. 5, 2023
En la actualidad los estudios y análisis de cada paciente dental son almacenados digitalmente en archivos e imágenes bidimensionales junto con el historial clínico para generar un expediente. En este trabajo se presenta un método de compresión de imágenes digitales de radiografías panorámicas dentales mediante el algoritmo de modulación de la matriz de cuantificación Lohscheller y su almacenamiento en archivos. Este método es de gran utilidad para usuarios y especialistas por el manejo de gran cantidad de información contenida en las imágenes en un espacio de almacenamiento reducido como se verá en los resultados.
Palabras clave: Matriz Lohscheller, Compresión Digital, Imágenes Dentales
Currently, the studies and analysis of each dental patient are stored digitally in files and two-dimensional images along clinical history to generate health records. This paper presents a method of compression of digital images of panoramic dental radiographs using the modulation algorithm of the Lohscheller quantification matrix and its storage in files of lower capacity. This method is very important to users and specialists, because of the management of a big amount of image information contained in a little storage space as will be seen in the results.
Keywords: Lohscheller Matrix, Digital Compression, Dental Imaging
El procedimiento para detectar patologías dentales es mediante inspecciones físicas y radiografías por diente o panorámicas del paciente para llegar a un diagnóstico. Hay deficiencias dentales que no son fáciles de identificar visualmente como: caries ocultas, fracturas molares, raíces dentales cortas, etc.; éstas se localizan de manera efectiva por radiografía, Figura (1).
Figura 1. a) Inspección física y b) radiografía dental con caries interna (Nueva Imagen Dental - NID)
La compresión de imágenes consiste en procedimientos que tratan de minimizar el número de bits necesarios para representar una imagen. Las aplicaciones de la compresión de imágenes son principalmente la transmisión y almacenamiento de información. Unas de las técnicas más conocidas para lograr la compactación de imágenes es JPEG, que es un estándar de compresión. Con los trabajos que el grupo ha estado realizando para resaltar bordes y contornos mediante matrices de convolución se pretende que el almacenamiento de los expedientes clínicos sea de menor peso (archivos de menor tamaño) sin perder calidad en las imágenes digitales para diagnóstico. El procedimiento de cuantificar consiste en dividir el bloque de una matriz “M” de 8X8 (64-bit) de una imagen que se obtiene de procesar la Transformada Discreta Coseno (TDC) en dos dimensiones, entre la matriz Lohscheller (LH) de las mismas dimensiones y redondear su resultado al valor entero más próximo. Luego, para llevar a cabo la modulación se multiplica la matriz Lohscheller por un factor τ de calidad entre 0 y 1, obteniendo mejores resultados en el proceso de compresión de la imagen.
Figura 2. Imagen digital de una radiografía panorámica con ausencia de órganos dentales y colapso de hueso (NID)
Es por ello por lo que se desarrolla JPEG 2000. Este estándar ofrece una mejor calidad subjetiva que JPEG y una mayor tasa de compresión y además ofrece una rica gama de nuevas características que consiguen el mismo éxito que tuvo su predecesor. Por ejemplo, con pérdida o sin pérdida de datos que son los detalles en la imagen que en algunos casos podría mejorar la calidad de la imagen o bien el mismo almacenamiento de imágenes. Además, JPEG 2000 ha sido pensado con multitud de campos de aplicación en mente, dispositivos multimedia, sistemas de información geográfica, transmisión satelital de imágenes por mencionar algunos. La Figura (3) muestra partes de proceso de compresión de imágenes según los estándares.
Figura 3. a) Barrido en zigzag de pixeles en una ventana de 8x8 para la cuantización (ITU-T81), b) esquema de reducción espacial del modo jerárquico del proceso de compresión usando la Transformada Coseno Discreta (ISO/IEC 10918-1) y b) compresión graduada de una flor usando el método JPEG. (Wikipedia)
El Joint Photographic Experts Group (en adelante JPEG) es el método de compresión más utilizado actualmente para la compresión de imágenes con pérdida. Este método utiliza la transformada discreta del coseno (DCT), que se calcula empleando números enteros, por lo que se aprovecha de algoritmos de computación veloces. El JPEG consigue una compresión ajustable a la calidad de la imagen que se desea reconstruir, [1].
El JPEG desarrolló un formato de almacenamiento de la imagen digital basado en estudios de la percepción visual humana. Describe una familia de técnicas de compresión de imágenes fijas de tonalidad continua en escala de grises o color (24 bits).
JPEG emplea un esquema de compresión con pérdidas basado en la codificación por transformación. Tras varios años de supremacía de JPEG como estándar de compresión de imágenes aparece un nuevo competidor. Los nuevos tiempos requieren una compresión de imágenes con mayor potencia, así como nueva funcionalidad. Figura (2) imagen a comprimir.
2.1 Procedimientos para la compresión de imágenes
Se parte de una imagen de 512X512 pixeles y se divide en pequeños bloques de 8×8 píxeles, con una sección de datos de la imagen original, [2-5].
Sub-Matriz de 8x8 pixeles
Después cada pequeño bloque se convierte al dominio de la frecuencia a través de la transformación discreta de coseno bidimensional, abreviadamente llamada DCT. El siguiente proceso es restarles 128 para que queden números en torno al 0, entre -128 y 127.
Matriz centrada entre los valores -128 y 127
El codificador básico implementa un algoritmo de compresión con pérdidas (no se puede recuperar en la decodificación exactamente de la imagen original) basado en el uso de la Transformada Discreta del Coseno (DCT). La transformación de la matriz por DCT, y el redondeo de cada elemento al número entero más cercano.
Matriz déspues de la DCT
Nótese que el elemento más grande de toda la matriz aparece en la esquina superior izquierda, este es el coeficiente DC.
JPEG incorpora las características del Sistema Visual Humano (SVH) en el proceso de compresión. Se ha demostrado que el sistema visual humano es más insensible a las variaciones de alta frecuencia. Aprovechando esta cualidad, se eliminará información de las imágenes a codificar (es por ello que el sistema tiene pérdidas) y se aprovechará este hecho para lograr la compresión, ver Figura (4).
Figura 4. Es un diagrama de bloques simplificado que muestra los procedimientos involucrados en la compresión JPEG
La decodificación es esencialmente el proceso inverso a la codificación. Se llevan a cabo los mismos procesos, pero en orden inverso. Las tablas de especificación usadas en el proceso de codificación se llevan junto con el flujo de datos después de la compresión y se usan para la descompresión. El decodificador convierte el flujo de bits comprimido en una nueva tabla de coeficientes DCT. Estos se multiplican entonces por los coeficientes de decuantificación y se alimentan en el proceso DCT inverso IDCT (Transformada Discreta del Coseno Inversa). La salida del proceso es un bloque de pixeles reconstruido de tamaño 8x8. Por supuesto, este bloque de pixeles de 8x8 podría no reproducir exactamente el original ya que se perdió alguna información en el proceso de codificación, ver la Figuras (5), [6].
Figura 5. Diagrama de bloques simplificado del proceso básico involucrado en la descompresión JPEG
Como ya habíamos comentado, el ojo humano es muy bueno detectando pequeños cambios de brillo en áreas relativamente grandes, pero no cuando el brillo cambia rápidamente en pequeñas áreas (variación de alta frecuencia). Esto permite eliminar las altas frecuencias, sin perder excesiva calidad visual. Este procedimiento se realiza dividiendo cada componente en el dominio de la frecuencia por una constante para ese componente, y redondeándolo a su número entero más cercano. Este es el proceso en el que se pierde la mayor parte de la información (y calidad) cuando una imagen es procesada por este algoritmo. El resultado de esto es que los componentes de las altas frecuencias tienden a igualarse a cero, mientras que muchos de los demás, se convierten en números positivos y negativos pequeños [7-10].
Una matriz de cuantificación típica es la matriz de Lohscheller que se usa opcionalmente en el estándar JPEG:
Matriz Lohscheller “LH” de Cuantización
Dividiendo cada coeficiente de la matriz de la imagen transformada DCT entre cada coeficiente de la matriz de cuantificación, se obtiene esta matriz, ya cuantificada:
Matriz Cuantificada
Por ejemplo, cuantificando el primer elemento, el coeficiente DC, quedaría así:
3.1 Factor de calidad (t)
Como se mencionó al final de la introducción, para lograr mayor o menor compresión mediante la cuantización de los coeficientes obtenidos por la TDC, se define el factor de calidad que multiplica a la matriz LH. El factor de calidad es un número que modifica a la matriz de cuantización JPEG, para el propósito de este trabajo funciona como un modulador que varía en incrementos de 0,1 entre 0 y 1. Cuando es mayor a 1, la imagen empieza a perder detalles, es decir se degrada. Se debe tener en cuenta que, mientras mayor sea el número en la matriz LH, menor cantidad de bits se utiliza para representar la componente que se ha dividido.
3.2 Resultados
Los resultados son mejores en el sentido de menor capacidad utilizada en bits o tamaño de la imagen comprimida. Se muestran los resultados obtenidos en gráficas después de modular la matriz LH de una imagen panorámica dental con respecto a su tamaño y a su porcentaje de compresión. Luego se presenta cómo, al regresar o recuperar los valores originales de la imagen, hay alguna pérdida en cuanto a tonos de color (que no es muy significativa para el tipo de diagnóstico). La Figura (6) muestra la descomposición de la imagen en las capas RGB.
Figura 6. Descomposición de imágenes digitales en capas RGB
Ahora veamos las imágenes durante el proceso de compresión, es decir la aplicación de las matrices en su caso, Figura (7).
Figura 7. Imágenes para las capas RGB y YUV en el proceso de compresión JPEG
En la Figura (8) y (9) se presentan las imágenes en tonos de grises de las capas RGB y YUV para la compresión y después de la descompresión o proceso inverso.
Figura 8. Planos RGB de una imagen dental tonos de grises primer fila e imágenes recuperadas después de hacer la compresión
Figura 9. Planos YUV de una imagen dental tonos de grises e imágenes recuperadas después de hacer la compresión segunda fila
En la gráfica de la Figura (10), se muestran cómo cambia el tamaño y porcentaje de compresión de la imagen con respecto al factor de calidad entre 0 y 1.
Figura10. Gráficas de Compresión
Para ver la degradación de las imágenes en el proceso de compresión se toman dos factores de calidad grandes, τ=1 y τ=2, Figura (11).
Figura 11. Comparación entre a) la imagen original, las RGB comprimidas y recuperadas con b) τ=1 y c) τ=2, respectivamente
El coeficiente de modulación t de la matriz LH está relacionado con la calidad y la tasa de compresión de la imagen. Para comparar las diferencias entre el bloque original y el comprimido, se halla la diferencia entre ambas matrices, la media de sus valores absolutos, da una ligera idea de la calidad perdida. La eficiencia en cuanto almacenamiento de estas imágenes comprimidas mejora en comparación con sólo en método JPEG estándar, en la gráfica de la Fig. (10) se mostró hasta un 95.5% de compresión sin perder detalles. Este método funciona para los valores de t entre 0 y 1. Luego para valores mayores de 1, se tiene una menor capacidad de compresión, es decir, crece el tamaño en bytes de la imagen comprimida y la imagen va perdiendo calidad. Puede haber otros factores que alteren la tasa de compresión de la imagen dentro del esquema de compresión JPEG, como usar la transformada discreta wavelet (TDW) en lugar de usar la transformada discreta coseno (TDC), que se analizarán en trabajos futuros. Realizando la modulación de la matriz de Lohscheller en el procedimiento de compresión JPEG de imágenes, se observa que los resultados obtenidos tienen un comportamiento de un crecimiento en el tamaño cuando el coeficiente de modulación t aumenta. Por otro lado, se observa una disminución en el porcentaje de compresión cuando la modulación aumenta. Este procedimiento puede usarse en otras aplicaciones para el intercambio de datos médicos.