Pastel de Data #22 • Outubro/23
Bem vindo à newsletter do Data Visualization Lisboa.
Novo semestre, nova cara e novo formato para o nosso querido Pastel de Data! 🙌 Se costumávamos dar a conhecer as pessoas que dão vida à comunidade da Visualização de Dados em Portugal e em português, agora viramos a nossa atenção para o seu trabalho. 🧐
Daqui em diante, as fornadas são de projetos quentes, recheados de Visualização de Dados e com um sabor bem Português! 🤓🇵🇹
Ocupação do solo em Portugal, por Pedro Tarroso, Ecologista
O projeto "Mapa Animado da Ocupação do Solo em Portugal" criado por Pedro Tarroso utiliza dados detalhados do COSsim2021 para apresentar, de maneira dinâmica e acessível, a distribuição e predominância de diferentes usos do solo em Portugal Continental.
1 - O que te inspirou a criar este projeto de visualização de dados?
Sempre fui apaixonado por mapas. Os atlas mundiais que tinha disponíveis em casa, durante a minha infância, foram provavelmente uns dos livros que mais me fascinavam. As introduções sobre o planeta Terra, com visualizações do interior do planeta, até aos detalhes da superfície, tudo era cativante. As legendas, muitas vezes enormes, eram quase como pequenos jogos em que tinha de encontrar todos os símbolos descritos no mapa. Todo o tipo de mapas me interessavam, incluindo mapas de estradas, folhetos informativos ou cartas militares! Mais tarde, associado ao gosto pela Natureza, compreendi que tudo tem um contexto espacial e é neste contexto que podemos por as questões mais interessantes, incluindo sobre a distribuição das espécies (porque é que há zonas do planeta com uma diversidade tão distinta de outras?), sobre o clima e o seu impacto sobre os padrões da biodiversidade. Ao estudar estes fenómenos, compreendi a dimensão da alteração da paisagem que nós, humanos, promovemos. Estamos constantemente a aumentar a distância entre a paisagem que imaginamos idílica e aquela que realmente temos à nossa volta.
A minha inspiração para este projeto é gerada na confluência de todos estes fatores. O gosto pelos mapas e pela Natureza levou-me a tentar produzir uma forma de visualização que tornasse clara a nossa influência no uso do solo. Quis criar uma visualização que fosse simples de compreender e que transmitisse a mensagem de que a área modificada suplanta largamente a natural.
2 - Como refinaste a tua ideia inicial num conceito concreto?
A minha ideia inicial baseava-se em poucas premissas: queria produzir um mapa animado, que pudesse mostrar como os pixels do uso do solo em Portugal se podem agrupar de outra forma. Como os dados usados tem bastante detalhe foi possível fazer um mapa com bastante resolução, onde os pixels são bastante pequenos, assemelhando-se a grãos de areia coloridos. O passar do tempo na animação assemelha-se então a areia a cair numa ampulheta. Tentei produzir uma animação que pudesse lembrar a areia a escorrer com o tempo, sendo a gravidade aqui a necessidade de agrupar os dados de outra forma. O agrupamento dos dados em espirais foi de certa forma influenciado pela minha formação em biologia: pensei na forma como a informação genética em todas as células vivas se condensa em pequenos cromossomas. Assim, pensei em agrupar os pixels em espirais onde cada ponto da espiral é uma espiral ainda mais pequena, quase invisível, condensando a imensa informação espacial.
3 - Quem imaginaste como o público alvo para a tua visualização de dados?
Apesar de não ter um público-alvo definido de início, queria que o mapa animado pudesse ser apelativo para o público geral. Isto é, para aqueles com um interesse geral em mapas, até aos que gostam de visualização de dados. Para os que gostam de animações até aos que têm interesse científico neste tipo de dados. Para as crianças que gostam de atlas e mapas até aos adultos que não perderam esse gosto!
4 - Encontraste algum desafio em aceder aos dados? Se sim, como conseguiste ultrapassar esses desafios?
A minha formação e experiência profissional passa muito por encontrar e manipular estes tipo de dados espaciais. Desta forma, não considero que o acesso aos dados tenha sido difícil ou um desafio neste contexto. Se considerar todo o percurso necessário para compreender os conceitos de informação geográfica necessários para manipular estes dados, então aí a resposta é tempo, perseverança e gosto pelos dados espaciais e mapas!
5 - Que decisões criativas tomaste em relação ao tipo de visualização? Porque optaste por uma visualização de dados com animação?
A grande decisão criativa foi como passar de uma mapa de usos de solo para uma explicação das proporções relativas de cada classe de uso. Seria fácil fazer uma imagem estática que mostrasse o mapa e as proporções, por exemplo, um simples gráfico de barras. A animação pareceu-me mais apelativa por mostrar de forma evidente a reorganização dos dados. Como a velocidade é igual para cada pixel, a animação traz um auxiliar de visualização: as classes de uso de solo com maior área demoram também mais tempo a agrupar. A animação dos dados pareceu-me que poderia ser uma forma distinta de fazer um mapa, aproveitando também a facilidade com que hoje se circula um vídeo por intermédio da internet e redes sociais.
Como seria um mapa para ver predominantemente em ecrãs, optei por um fundo negro para dar mais ênfase no brilho das cores dos dados e do movimento. Procurei ter elementos essenciais do mapa (título, legenda, escala, etc) que fossem visíveis mas discretos. Em relação às cores de cada uso do solo, segui a sugestão da fonte dos dados. Em geral, os mapas de Portugal aparecem em página vertical devido à forma do país. Aqui preferi usar uma página horizontal pois permite um maior movimento dos pixels e melhor organização dos dados. Uma outra decisão que apareceu com as sucessivas experiências foi o aparecimento das legendas de cada espiral com uma transparência associada ao acumular de dados. Assim, a animação não revela informação logo de início e, suponho, ajuda a manter a curiosidade ao longo da animação.
6 - Fizeste alguma transformação ou pré-processamento de dados para permitir uma visualização mais eficaz? Podes detalhar esses processos?
Os dados originais têm uma resolução espacial muito elevada. Isto significa que cada pixel nos dados originais representa uma área real relativamente pequena, no caso 10x10 metros, o que resulta numa imagem enorme (mais de 1650 megapixels). O vídeo original tem uma resolução 8K, ou seja, 7680x4320 pixels (33.2 megapixels). Isto obrigou-me a efetuar um pré-processamento dos dados de forma aos pixels serem visíveis na animação. O método é bastante simples e é baseado na reamostagem dos pixels. Para cada conjunto de 8x8 pixels é feito um sumário dos valores, ou seja cada novo pixel é o resultado de um sumário de 64 pixels. A forma que escolhi de sumarizar foi atribuir ao novo pixel a classe que tem maior proporção nessa área. No entanto, queria calcular as proporções de usos de solos distintos com os dados originais e não na imagem reamostrada. Assim, enquanto produz a reamostragem, o código também conta o número de pixels originais por cada uso do solo.
7 - Que linguagens de programação, bibliotecas ou ferramentas utilizaste para criar a visualização? Podes detalhar alguns aspetos técnicos do teu projeto?
Um dos objetivos e motivações para este projeto foi também ganhar maior experiência em manipular dados espaciais em Python. Assim, todo o mapa foi gerado nesta linguagem. Tentei não criar demasiadas dependências de módulos de Python, na tentativa de facilitar o uso por outros possíveis interessados no código. Assim usei o ‘numpy’ para algum processamento numérico, ‘matplotlib’ para a produção dos mapas, e ‘gdal/osgeo’ para importar dados espaciais.
Desde que divulguei este mapa recebi imensos pedidos para disponibilizar o script. Essa era a ideia original e finalmente consegui reorganizar o código de forma a ser fácil de usar, mesmo para quem não tenha experiência em programação. O script “MapAnim” pode ser encontrado aqui: https://github.com/ptarroso/MapAnim
8 - Além do apelo visual, que descobertas é que esta tua visualização de dados revelou? Algo inesperado?
Como trabalho com estes dados regularmente, a visualização não trouxe grande novidade na interpretação dos dados. No entanto, a nível pessoal, confirmou que todo o processo criativo que produz novas formas de visualizações de dados é muito apelativo, desde a conceção da ideia até à execução do código. Gostei do processo de criar este mapa animado, como foi também particularmente gratificante a receção geral onde foi divulgado, incluindo este convite para responder a algumas perguntas!
9 - Como vês a evolução da visualização de dados no teu domínio específico ou o panorama da visualização de dados em Portugal nos próximos anos?
A visualização de dados é cada vez mais importante e por isso assistimos a uma constante evolução das ferramentas disponíveis, alimentando o processo criativo. O que requeria uma formação muito qualificada, agora está ao acesso de muitos interessados, o que cria um desafio adicional de ser criativo no meio de trabalhos tão bem elaborados. Acho que há um fator preponderante na necessidade de visualização que é o fator “big data”. Nos dias de hoje, não só se recolhe imensa informação digital (desde cliques em websites até imagens satélite do planeta) como é facilitado o acesso global a estes dados. No entanto, a quantidade de dados implica uma maior dedicação na tentativa de extrair informação com sentido. Aqui é onde o processamento de dados e a visualização têm um papel preponderante, o de sumarizar e passar uma mensagem, procurando informação na nuvem de dados. Neste sentido, não acho que Portugal seja diferente do resto do mundo e cada vez será mais comum ver dados portugueses em belíssimas visualizações.
Na minha área de trabalho, em investigação em biologia, faz sentido na mesma medida. Cada vez temos mais dados disponíveis e mais ferramentas para analisar. No entanto, é necessário que a informação não fique num domínio muito restrito de pessoas. A visualização de dados é essencial para passar conteúdos científicos para o público geral, de uma forma intuitiva, clara e informativa. Suponho que o futuro da visualização é ainda o mesmo que lhe deu origem: aproximar as pessoas da informação relevante disponível através duma mensagem clara e apelativa.
Se tens algum projeto que gostavas de ver por aqui, envia-nos um comentário, mas lembra-te: deve ter sido realizado em Portugal 🇵🇹
Sara
Ando fascinada com os projectos do Senseable City Lab, um grupo de investigação do Massachusetts Institute of Technology (MIT). Para além de toda a componente digital e de investigação aplicada às cidades, eles assentam muitos dos seus projectos na visualização de dados. O resultado está à vista numa exposição chamada Mapping the [In]visible, onde tentam mostrar o que os dados podem revelar acerca dos nossos comportamentos. Publicaram também recentemente o livro Atlas of the Senseable City onde abordam alguns dos projectos do grupo, sempre à volta da intersecção entre dados, cidades e design.
Renata
A Britannica All New Children's Encyclopedia é uma verdadeira preciosidade para qualquer estante de livros de crianças (ou adultos)! Com mais de 400 páginas de assuntos interessantes e muito bem infografados, lembrei-me muito das antigas enciclopédias que existiam na casa da minha avó. Repleto de imagens incríveis e curiosidades divertidas, eu tive um ótimo momento lendo-o em família.
Acessibilidade e DataViz
Como usar cor de forma mais consciente? – Parte 1
A Acessibilidade abrange um conjunto de práticas destinadas a tornar mais inclusivos o planeamento, design e utilização de espaços, experiências ou produtos. No campo da Visualização de Dados passa por apresentar a informação de forma a que seja facilmente navegável e assimilável por variados utilizadores, independentemente de dificuldades visuais, motoras, auditivas, ou até níveis de conhecimento.
Esta tentativa de alargar o público-alvo deve ser um princípio condutor para qualquer criador de conteúdos, permitindo combater sistemas de discriminação que excluem muita gente de um acesso universal à informação.
Como sabemos que pensar a acessibilidade pode ser uma tarefa hercúlea, ao longo dos próximos meses vamos dar-te pequenas dicas de como tornares as tuas visualizações mais acessíveis.
Comecemos pelo tema da Cor. Este é um poderoso atributo qualitativo e deve, por isso, ser usado frugal e intencionalmente:
Não uses mais do que 4–5 cores para distinguir diferentes categorias.
Um erro comum é o uso excessivo de cores em dataviz. Mesmo em utilizadores sem qualquer grau de deficiência, a memória a curto prazo não armazena mais do que 4–5 elementos. Por isso, analisar um gráfico com seis ou mais categorias de cores torna-se fastidioso, obrigando-nos a ler constantemente a legenda para nos recordarmos qual a cor de cada categoria.
Assim, antes de usares alguma cor no teu gráfico, pergunta-te se realmente precisas dela, e se a distinção não pode ser mais facilmente resolvida por legendagem directa. Esta abordagem pode inclusivamente dar-te a oportunidade de colorires e enfatizares uma única categoria de interesse.
Usa cores facilmente nomeadas.
Antes de criares uma escala de cores, pensa como é que os utilizadores falarão sobre o gráfico. Cores muito parecidas ou demasiadas categorias de cores, invariavelmente obrigarão as pessoas a utilizar nomes de cores mais obscuros, que nem toda a gente dominará, e que retiram objectividade à discussão.
Cuidado com os significados das cores.
Certas cores têm significados óbvios e são por isso úteis – como as cores dos partidos em gráficos eleitorais. No entanto, em muitas outras situações evita recorrer aos significados específicos das cores, pois essas associações são profundamente culturais e poderão perder o sentido se estiveres a comunicar com um público diversificado e/ou internacional (por exemplo, o luto é associado ao preto em muitos países ocidentais, mas na China é o branco).
Por fim, evita usar cores que reforcem estereótipos, por exemplo, de género. Vê porquê e que alternativas existem neste óptimo artigo da Lisa Charlotte Muth no Datawrapper.
Este foi apenas um cheirinho do que temos para te contar. Segue-nos ao longo dos próximos meses para aprenderes mais sobre acessibilidade e dataviz.Escreve-nos se tiveres alguma questão ou experiência relevante sobre este tema que queiras partilhar.
Se gostas do nosso Pastel de Data, não hesites em encaminhá-lo para que outros o possam também saborear. Até o próximo mês!









