rgb2xyz3d+algoritmo

Na série rgb2xyz imagens 2D são transportadas para o espaço 3D de acordo com os valores RGB de cada pixel. As imagens resultantes são únicas e permitem novos olhares – ou visualizações – da informação das imagens originais.

rgb2xyz
Esta série foi criada no software 3d Studio MAX via Maxscript. O algoritmo é relativamente simples: os pixels da imagem original são representados por esferas (de mesma cor do pixel correspondente) no espaço 3D, com suas posições (x,y,z) determinadas pelos respectivos valores de cor (r,g,b).

Escolhi como referência para esta série quatro imagens de naturezas bem diversas, de forma a explorar ao máximo as qualidades e aspectos que seriam favorecidos e evidenciados pela transformação proposta. São elas: a Mona Lisa (representando uma arte clássica), a Banana do Andy (visual mais estilizado), Mrs. Monroe (uma fotografia deveras icônica) e a Natureza.

A seguir detalho as visualizações e experimentos realizados com cada uma das quatro referências originais.

Mona Lisa
A representação rgb2xyz da Mona Lisa (aqui) reflete a predominância do marrom e tons próximos, bem como a homogeneidade no uso das cores (o volume é coeso, sem protuberâncias significativas ou elementos ‘soltos’).

Imagens da versão ‘plana’ (ou seja, com os elementos posicionados de acordo com a posição original) podem ser vistas aqui e aqui. Criei versões ‘planas’ para todas as imagens, de forma a servir de comparação (e também porque gosto do visual ‘arredondado-pixelado’).

Banana do Andy
A representação rgb2xyz da Banana do Andy (aqui) apresenta uma configuração interessante, desenhando uma espécie de triângulo no espaço, uma vez que a imagem é composta de basicamente três cores (amarelo, branco e preto).

Além da versão ‘plana’ (aqui), também experimentei uma variação, com a posição z dos elementos determinada pela intensidade de cor (aqui) – o resultado não ficou grandes coisas.

Mrs. Monroe
Bastante interessante Mrs. Monroe em rgb2xyz (aqui). A imagem é visualmente (além de historicamente, é claro) icônica, e assim se assemelha à Banana de Andy – isso se reflete na ‘ordem’ do volume resultante. Mas ela também é uma fotografia, e portanto possui um aspecto muito mais orgânico, que pode ser percebido na continuidade da forma.

Coincidência ou não, o formato, digamos, vigoroso e prafrentex do volume tridimensional resultante da transformação (aqui) me parece bastante compatível com o conteúdo da imagem original (se é que você me entende).

Para esta imagem, além da versão ‘plana’ de costume (aqui), também gerei uma visualização em resolução mais alta (aqui) – veja em maior detalhe aqui.

Natureza
O volume rgb2xyz da natureza (aqui) é relativamente grande, sugerindo a maior variação de tons (em torno da cor base – verde) em um ambiente natural em comparação com as imagens ‘artificiais’.

Outro aspecto curioso que me parece ser evidenciado nesta representação é a compressão do espaço de cores que acontece no momento do registro fotográfico (e na transcodificação digital), visível pelos ‘cantos duros’ no volume tridimensional (contrastando com o caráter orgânico da cena registrada). Posso estar enganado…

A versão ‘plana’ da Natureza (aqui) ficou bem bonita.

Experimentos e Testes
Além destas visualizações, fiz mais alguns experimentos, de forma a explorar um pouco mais as características da transformação rgb2xyz.

Em um dos experimentos, criei uma imagem com ruído (através de um dos filtros ‘noise’ do Photoshop) e rodei o algoritmo, pensando que isso levaria ao preenchimento homogêneo do espaço tridimensional. O resultado foi bem diferente do esperado – os elementos se concentraram nas ‘bordas’ (ou arestas), indicando que este filtro cria um ruído bem específico, que varia bastante as cores em si, mas mantém a intensidade delas ao máximo.

Depois apliquei um ‘blur’ (desfoque) na imagem original do ruído, de forma a constatar a alteração na representação rgb2xyz. Veja aqui – na parte esquerda, a imagem com ruído – sem blur (em cima) e com blur (embaixo) -, à direita, suas representações em rgb2xyz.

Criei uma composição mostrando a fusão das duas representações da imagem de ruído (com e sem blur), em uma mesma perspectiva ortogonal (aqui).

Note que na representação rgb2xyz do ruído (sem blur) há alguns elementos dispersos no centro do espaço – acredito que eles sejam referentes à imagem original sobre a qual apliquei o filtro de ruído (usei a imagem original da Mona Lisa como base).

Antes de gerar as visualizações das imagens mostradas acima, fiz um teste com uma imagem teste contendo apenas as cores puras do espaço RGB (vermelho, verde e azul), em proporções iguais. Como esperado, o resultado (aqui) foi a concentração dos elementos na ponta de cada eixo (x,y,z), correspondendo às cores (r.g,b).

Também fiquei curioso para ver o espaço rgb2xyz totalmente preenchido (como se fosse a paleta deste espaço). Modifiquei um pouco o algoritmo (que originalmente se baseava em uma imagem) e gerei o modelo correspondente (aqui).

Como o processo de amostragem e geração do modelo tridimensional é bastante demorado (principalmente no meu modesto computador), antes de mais nada eu fiz alguns testes de forma a decidir qual seria a resolução de amostragem ideal (veja as imagens aqui). Por fim, criei um monstrinho.

Obs: a idéia para esta série foi inspirada em um ótimo trabalho da amiga Juliana Henno, estudiosa das cores.

2 Comentários »

  1. Caro Daniel. Muito interessante a mudança de uma figura em 2d para a interpretação em 3d. A figura da Mrs. Monroe em 2d é muito suave e bela. As 3d parecem vírus como nas microfotografias científicas.
    valeu. Um abraço A.S.

    Comentário de arlan — 2010/04/02 @ 09:22

  2. Valeu! Parecem bichos mesmo.

    Notei que faltou ressaltar um pouco mais que esta não é a única transformação rgb2xyz possível destes dados (imagens) – eu determinei minhas próprias regras, que se fossem outras poderiam levar a formas totalmente diferentes (eu poderia, por exemplo, ter invertido os eixos).

    No próprio Photoshop, por ex, também existem visualizações diversas da informação de cor em uma imagem.

    Mas a idéia principal é que, seja qual for a “regra” usada, sempre há a possibilidade de que ela leve a um novo olhar sobre aquela mesma informação.

    Comentário de 7luas — 2010/04/02 @ 09:38

Feed RSS para os comentários deste post. Trackbacks

Deixe um comentário

Powered by WordPress