Pastel de Data #23 • Novembro/23
Bem vindo à newsletter do Data Visualization Lisboa.
Nesta temporada, estamos a mostrar projetos de visualização de dados feitos em Portugal. Se tiveres alguma sugestão, envia-nos.
Regra 3-30-300 aplicada a Lisboa, por Manuel Banza (Cientista de dados) e Bernardo Fernandes (Sociólogo)
O projeto “Regra 3-30-300 aplicada a Lisboa”, criado por Manuel Banza e Bernardo Fernandes, é o primeiro artigo do Fazer Cidade e mostra quais os edifícios de Lisboa que cumprem a regra:
3 árvores visíveis da janela
30% de cobertura da copa das árvores no bairro
300 metros de um jardim
1 - O que vos inspirou a criar este projeto de visualização de dados?
Este primeiro artigo do Fazer Cidade sobre a regra 3-30-300, que nos diz se o lugar onde vivemos está ou não preparado para fazer frente ao calor extremo, nasce de uma vontade inicial nossa de escrever um livro que abordasse várias problemáticas do território urbano relacionadas com a proximidade, os espaços coletivos e a decisão. Começamos, por isso, de forma mais pragmática a esquematizar alguns artigos que queremos escrever e no processo convidar mais pessoas a escrever connosco. Focamo-nos especialmente em Lisboa, queremos, através dos dados, expor os desafios e propor políticas públicas para o espaço coletivo. Queremos viver numa cidade mais humana e equilibrada na utilização do espaço que pertence a todas as pessoas, queremos que esta cidade possa ser mais relacional, leve e divertida.
2 - Como afinaram a ideia inicial para chegarem a um conceito mais concreto de visualização de dados?
Este artigo parte do pressuposto que as pessoas têm pouco acesso a espaços verdes de qualidade e que permitam o abrigo do calor extremo que se tem vindo cada vez mais a sentir. Queríamos abordar isto de uma forma interativa e apelativa, portanto começamos a pesquisar conceitos e a compor a história. No Fazer Cidade uma das principais preocupações é mesmo que qualquer pessoa (que tenha conhecimentos básicos de utilização de um telemóvel ou computador) consiga interagir com os dados que produzimos. Estamos cansados da monotonia dos dados estáticos, e neste caso as pessoas podem pesquisar as várias zonas dos mapas com diferentes camadas de informação e introduzir a sua morada para verificar se o seu prédio cumpre os requisitos da regra.
3 - Quem imaginam como o público alvo para este projecto?
Naturalmente gostaríamos que fosse para todas as pessoas, mas seria irrealista afirmar isso. Sabemos que não é qualquer pessoa que se senta ao computador e pensa “apetece-me mesmo ler um artigo de 25min”. Este artigo é para pessoas que têm tempo e recursos para aceder à informação, consome notícias online e se interessa por questões de urbanismo e ambiente. Para quem tenha vontade de explorar informação além do artigo, também oferecemos muitas fontes para consulta.
qualquer pessoa que se identifique
tempo para ler o artigo todo
ter recursos para aceder à informação num espaço relativamente codificado
pessoas que consomem notícias online
4 - Tiveram dificuldade em aceder a dados? Se sim, como conseguiram ultrapassar isso?
Sim, enfrentamos algumas dificuldades no acesso a dados, contudo, Lisboa mantém uma boa base de dados abertos comparada com outras cidades de Portugal. Embora tenha estagnado, quer na incorporação de novos conjuntos nos últimos anos, quer na atualização dos já existentes. Enquanto cidadão devemos ter mais atenção a esta questão porque é uma grande mais valia que podemos vir a perder no futuro.
Para a análise da cobertura arbórea, recorremos a dados produzidos através de imagens satélite da Copérnico, mas com dados de 2018. Acrescentamos ainda dados de árvores mais recentes que não estavam no dataset da Copérnico (em 2018) e desta forma conseguimos ter uma aproximação mais parecida com a realidade.
No entanto quando olhamos para outras cidades, principalmente aqui ao lado em Espanha, vemos que a informação disponível em dados abertos é bastante maior. Basta vermos o exemplo da disponibilização de valores de rendas de habitação por rua disponibilizados pelo INE espanhol, ou os dados de copa das árvores disponibilizados pela cidade de Barcelona.
5 - Fizeram alguma transformação ou pré-processamento dos dados, para permitir uma visualização mais eficaz? Podem detalhar esses processos?
Em primeiro lugar, obtivemos dados das seguintes fontes:
Edifícios de Lisboa (Open Street Map)
Árvores em Lisboa (Câmara Municipal Lisboa)
Espaços verdes de Lisboa (Discord LPP)
Tree Cover Density, 2018 (Copernicus)
Street Tree Layer – STL, 2018 (Copernicus)
Tendo em conta os dados disponíveis, de modo a o resultado ser o mais próximo da realidade possível, realizamos várias transformações dos dados. Para o tratamento dos dados e cálculo da regra, procedeu-se aos seguintes passos:
Edifícios: primeiro, importou-se todos os edifícios de Lisboa através do Open Street Map. Depois, criou-se o centroid (ponto mais central do edifício) para cada polígono que representa cada edifício. Este ponto será a base para calcular as três regras (3, 30, 300);
Cálculo da Regra 3: Com este dataset, calculou-se um raio de 50 metros desde cada centroid (ponto mais central do edifício) e o número de árvores que estão dentro desse raio;
Cálculo da Regra 30: primeiro, importou-se os dados provenientes de imagens satélites da Copérnico – Tree Cover Density 2018 e Street Tree Layer. De seguida, cruzou-se os dados referidos acima, bem como os pontos das árvores de Lisboa utilizadas para a regra 3, de forma a verificar se existem árvores que não foram contabilizadas nas imagens satélite. Nos casos em que se verificou isso, decidiu-se atribuir um raio de 1,5 metros a cada árvores, de forma a simular uma copa da árvore. O valor 1,5 metros é bastante conservador mas foi optado por se tratar de algo bastante difícil de prever, segundo vários estudos consultados. Apontou-se para o valor médio das árvores mais recentes, até porque serão as árvores implementadas após 2018 que não constam nas imagens satélite. Por último, calculou-se para cada secção estatística fornecida pelo INE, a área de cobertura verde, usando os dados dos pontos acima;
Cálculo da Regra 300: utilizou-se o dataset Espaços Verdes de Lisboa. A actualização dos mesmos é realizada pela comunidade do Discord do Lisboa Para Pessoas, verificando-se que tinham jardins mais recentes que não constavam nos dados da CML. Foram usadas as camadas que se enquadram apenas em jardins e parques. De seguida, calculou-se um raio de 300 metros desde cada centroid (ponto mais central do edifício) e identificou-se se esse raio intersecta algum dos jardins ou parques.
6 - Que linguagens de programação, bibliotecas ou ferramentas utilizaram para criar a visualização? Podem detalhar alguns aspetos técnicos?
Todo o processo de transformação dos dados foi realizado com linguagem de programação Python. Para isso foram usadas as seguintes bibliotecas:
Geopandas: Tudo o que seja transformação de dados geoespaciais, desde a criação dos buffers, como a intersecção entre os edifícios e os jardins, copa das árvores ou árvores;
osmnx: Para obtenção dos dados relativos aos edifícios de Lisboa.
Para visualização dos dados e criação do mapa interactivo usámos 2 ferramentas:
Kepler.gl: Biblioteca em python que permite facilmente criar mapas com as camadas dos dados que temos. Usámos esta ferramenta para os mapas individuais (regra 3, regra 30 e regra 300);
Mapbox GL JS: Para o mapa final que é bastante mais interactivo e permite a qualquer pessoa pesquisar directamente uma morada. A programação deste mapa foi feita com JavaScript.
7 - Que descobertas é que esta vossa visualização de dados revelou? Algo inesperado?
Esta análise de dados revelou diferentes cenários, com descobertas tanto positivas quanto negativas. Entre os aspetos positivos, destacamos que 77% dos edifícios estão próximos de parques ou jardins, ressaltando a importância desses espaços na regulação térmica e no combate ao efeito de ilha de calor. No entanto, nos pontos negativos, descobrimos que apenas 2% dos edifícios parecem cumprir simultaneamente os três princípios analisados. A centralidade dos parques urbanos na regulação térmica foi evidente, já outros parques sem sombra e apenas com relva mostraram ter pouca força no combate ao efeito da ilha de calor, como é o caso da Alameda Dom Afonso Henriques. Algumas descobertas validaram conceitos pré-existentes, como a frente ribeirinha, que, apesar da proximidade ao rio, não garante temperaturas mais baixas devido à configuração dos edifícios, criando barreiras à circulação de ventos e aumentando o efeito de ilha de calor.
8 - Como vêem a evolução da visualização de dados nos vossos domínios específicos (Sociologia, Urbanismo e Mobilidade) nos próximos anos?
Estamos cansados dos dados aborrecidos, estáticos e cinzentos. Deixamos aqui apenas um dos muitos exemplos do que se tem vindo a fazer em matéria de tratamento e apresentação de dados num artigo da Cooperativa Médor de Bruxelas e que nos serve de inspiração. A história mostra-nos como os dados são cruciais para a tomada de decisão e intervenção urbanística, relembrando por exemplo a importância do trabalho de Jon Snow no mapeamento da cólera em Londres.
Na nossa visão, seja em que domínio for das políticas para o território, vemos os dados como ferramenta de apoio à promoção de cidades saudáveis, onde as pessoas queiram morar e o possam fazer de uma forma leve e descontraída. Os mapas têm, entre outras funções, o poder de simplificar e clarificar a leitura e a análise para tomarmos decisões mais informadas. Não queremos fazer cidades "smart" para controlar a população, queremos usar os dados para promover um urbanismo que ponha as pessoas em primeiro lugar. O Urbanismo do Comum, aposta precisamente na participação cidadã e na proteção da vida quotidiana, e esta é a nossa base. A cidade ideal não é a tecnológica, é a humana. A política e a visão da cidade que queremos vêm primeiro, depois focamo-nos nos dados para obtermos uma visão panorâmica e informar a população a tomar uma decisão para concretizar a visão coletiva. E sempre nesta ideia de revisitar e reanalisar os dados, Identificar falhas, e o que pode ser feito para melhorar.
No futuro, vemos os dados a impulsionar uma cidade mais justa, progressiva e verdadeiramente centrada nas pessoas, e para isso precisamos de mais coletivos a Fazer Cidade, a disputar politicamente a direção que queremos para a nossa cidade, a construir em conjunto a distribuição e a composição dos espaços coletivos e dos espaços privados, a exigir e ajudar a desenvolver as ferramentas que permitem decidir e intervir democraticamente no território que pertence a todas as pessoas.
Se tens algum projeto que gostavas de ver por aqui, envia-nos um comentário, mas lembra-te: deve ter sido realizado em Portugal 🇵🇹
Salomé
As visualizações não têm de ser feitas apenas por profissionais de Visualização de Dados. Há anos que sigo o trabalho de ilustração da Marta Nunes. Ela faz ilustrações simples, quase monocromáticas, muitas vezes referentes à liberdade ou identidade portuguesa. No final de outubro, a Marta partilhou uma visualização incrível a representar as então mais de 8000 vidas palestinianas que se perderam durante o cerco israelita à Faixa de Gaza. Fiquei sem palavras. Tal como nas suas ilustrações, a Marta conseguiu transparecer tanto sofrimento e miséria de uma forma extremamente simples.
Rita
Enciclopédias podem ser consideradas entediantes para alguns, mas esta não. O Flower Gang desenvolveu "A enciclopédia das flores" e com ela uma forma cativante de apresentar uma enciclopédia! É uma coleção de dados sobre flores, com foco na sua cor e tamanho, para transmitir informação de uma forma diferente. Além da descrição das espécies, podem encontrar ótimos exemplos de visualização de dados como a cor, diâmetro, habitat, temperatura ideal e época de floração das flores.
Acessibilidade e DataViz
Como usar cor de forma mais consciente? – Parte 2
Ao longo dos próximos meses vamos dar-te pequenas dicas de como tornares as tuas visualizações mais acessíveis.
(Se não viste as edições anteriores, começa por ler um pouco mais sobre Acessibilidade e vê aqui as dicas passadas).
Este mês continuaremos a falar de Cor. Depois de abordarmos escalas categóricas, damos-te agora a conhecer algumas boas práticas sobre escalas de cor sequenciais e divergentes:
Escalas sequenciais – menos é mais
Estas escalas são muito úteis para visualizar variáveis quantitativas em mapas e em heatmaps – cores mais escuras indicam valores mais altos. Se o fundo da página for escuro, o valor mais alto deve ter a cor mais clara, para maior contraste.
Ao contrário de visualizações grandes, com muitos valores, onde pretendemos apreciar um padrão e não conhecer o valor exato de cada área, em visualizações mais pequenas é preferível não mais do 3–4 níveis de luminosidade. Caso contrário, torna-se difícil distinguir entre categorias. Podes contornar isto agrupando algumas das categorias de luminosidade e/ou usando legendagem directa.
Escalas divergentes de cor
Estas escalas são usadas quando existe um claro valor médio (zero ou uma meta), ou quando queremos enfatizar valores muito altos ou muito baixos em categorias opostas – por exemplo, quando falamos em valores positivos ou negativos, resultados de eleições bipartidárias, como nos EUA, ou até valores de temperatura em visualizações sobre alterações climáticas. Há um valor intermédio mais claro, e depois cada extremo tem uma cor diferente progressivamente mais escura.
O par de cores usado em escalas divergentes deve ser criteriosamente escolhido para evitar problemas para utilizadores com daltonismo, ou em versões a preto e branco. Falaremos um pouco mais sobre isso nas próximas duas edições da newsletter.
Para terminar, deixamos-te duas ferramentas:
Chroma.js Color Palette Helper, criada por Gregor Aisch, que te ajudará a criar escalas de cor sequenciais e divergentes, fazendo automaticamente pequenas correções à saturação e luminosidade de cada categoria para garantir uma visualização mais eficaz.
Color Brewer, criada pela Pennsylvania State University especificamente para cartografia, e que também te ajudará a criar escalas de cor.
Segue-nos ao longo dos próximos meses para aprenderes mais sobre acessibilidade e dataviz. Escreve-nos se tiveres alguma questão ou experiência relevante sobre este tema e que queiras partilhar.
Se gostas do nosso Pastel de Data, não hesites em encaminhá-lo para que outros o possam também saborear. Até o próximo mês!









