Descoberta de relações alométricas entre população e crime dentro de uma grande metrópole

10/04/2018
by   Carlos Caminha, et al.
0

Recently humanity has just crossed an important landmark in its history with the majority of people now living in large cities. This population concentration is capable of boosting the growth of positive indicators such as innovation, the production of new patents and supercreative employment, but increases the spread of diseases and the occurrence of crimes. Faced with the realization that crime rates grow year after year in these large urban centers, we sought to understand the dynamics of crime within cities. We investigate at the subscale of the neighborhoods of a highly populated city the incidence of property crimes in terms of both the resident and the floating population. Our results show that a relevant allometric relation could only be observed between property crimes and floating population. More precisely, the evidence of a superlinear behavior indicates that a disproportional number of property crimes occurs in regions where an increased flow of people takes place in the city. For comparison, we also found that the number of crimes of peace disturbance only correlates well, and in a superlinear fashion too, with the resident population. Our study raises the interesting possibility that the superlinearity observed in previous studies [Bettencourt et al., Proc. Natl. Acad. Sci. USA 104, 7301 (2007) and Melo et al., Sci. Rep. 4, 6239 (2014)] for homicides versus population at the city scale could have its origin in the fact that the floating population, and not the resident one, should be taken as the relevant variable determining the intrinsic microdynamical behavior of the system. This finding was the motivation for the codification of a framework that supports the analysis of population and crime data to propose city divisions that allow the allocation of police by floating population and resident population statistics.

READ FULL TEXT VIEW PDF
POST COMMENT

Comments

There are no comments yet.

Authors

02/20/2020

Measuring Spatial Subdivisions in Urban Mobility with Mobile Phone Data

Urban population grows constantly. By 2050 two thirds of the world popul...
08/19/2018

Spatio-temproal prediction of crimes using network analytic approach

It is quite evident that majority of the population lives in urban area ...
12/30/2020

More crime in cities? On the scaling laws of crime and the inadequacy of per capita rankings – a cross-country study

Objectives: To evaluate the relationship between population size and num...
08/19/2018

Spatio-temporal prediction of crimes using network analytic approach

It is quite evident that majority of the population lives in urban area ...
07/09/2018

Spatio-temporal variations in the urban rhythm: the travelling waves of crime

In the last decades, the notion that cities are in a state of equilibriu...
08/04/2018

An Extreme Value Analysis of the Urban Skyline

The world's urban population is expected to grow fifty percent by the ye...
08/09/2019

Reconstructing commuters network using machine learning and urban indicators

Human mobility has a significant impact on several layers of society, fr...
This week in AI

Get the week's most popular data science and artificial intelligence research sent straight to your inbox every Saturday.

1 Contexto

Relações sociais diretas, como interações entre conhecidos, ou indiretas, como o uso compartilhado de recursos naturais (e.g. visitar uma praia ou um parque ecológico) ou artificiais (e.g. usar um transporte coletivo) são importantes elementos que potencializam o que abstratamente é conhecido como a dinâmica de uma cidade ou, mais genericamente, de um aglomerado urbano (e.g. regiões metropolitanas). Essas relações têm especial impacto no comportamento do crime, sendo objeto de estudo de áreas diversas. Majoritariamente, as ciências ditas sociais têm buscado explicar fenômenos relacionados ao comportamento violento e delituoso por meio de pesquisas qualitativas [Michael e Adler 1933, Cohen e Felson 1979, Felson 2002, Clarke e Felson 1993]. A era digital, em que dados sobre o comportamento humano passaram a ser registrados em um nível de granularidade nunca antes imaginado, trouxe novos atores à cena da pesquisa em ciências sociais com novos instrumentos para apoiar a compreensão da dinâmica das cidades e do crime em particular baseados em modelos quantitativos [Filho et al. 2001, Guedes, Furtado e Pequeno 2014, Wang et al. 2013, Kiani, Mahdavi e Keshavarzi 2015, Caminha e Furtado 2012, Furtado et al. 2012, Wang 2005, Melo et al. 2014, Alves et al. 2013, Alves, Ribeiro e Mendes 2013, D’Orsogna e Perc 2015, Alves et al. 2015, Short et al. 2008, Short et al. 2010].

Um exemplo de como esses modelos quantitativos podem ser aplicados refere-se à forma como o conceito de alometria - um termo originalmente concebido na Biologia para descrever relações de causa e efeito com característica livre de escala, e.g., a relação entre a massa e a taxa metabólica de organismos [Kleiber 1932] – foi adaptado ao contexto social para compreensão da dinâmica de cidades [Naroll e Bertalanffy 1956].

Na Biologia, mostrou-se que a taxa metabólica dos organismos escala sublinearmente em relação à massa dos mesmos. Ou seja, o gasto de energia dos animais é desproporcional a sua massa, indicando uma certa eficiência dos organismos vivos, pois, por exemplo, o dobro da massa acarretaria um aumento menor do que duas vezes no gasto metabólico. De maneira análoga aos estudos biológicos, a população de uma cidade equivaleria a massa dos organismos vivos, tendo o papel de dimensionar o objeto de estudo. A ideia é de que sirva para compreender o efeito que o seu crescimento tem sobre indicadores correlacionados, como indicadores sociais (crimes) e ambientais (emissão de ). Uma relação alométrica, em um contexto social, pode ser descrita por uma função de lei de potência,

(1)

onde usualmente representa a população, quantifica um indicador social, é uma constante e é o expoente alométrico.

A descoberta de relações alométricas em fenômenos sociais tornou-se uma promissora linha de pesquisa, sendo capaz de estimar o impacto que as relações sociais podem causar em indicadores relacionados à dinâmica das cidades [Gomez-Lievano, Youn e Bettencourt 2012, Ignazzi 2014, Hanley, Lewis e Ribeiro 2016, Alves et al. 2015, Arcaute et al. 2016, Cottineau et al. 2016, Leitão et al. 2016, Bettencourt 2013, Arbesman, Kleinberg e Strogatz 2009]. Digno de menção é o trabalho de Bettencourt et al. [Bettencourt et al. 2007], que revelou que relações alométricas estavam presentes em muitos aspectos infraestruturais e dinâmicos de cidades americanas. Os autores utilizaram população residente como medida de dimensão de cidades e estudaram o efeito que o crescimento das mesmas exerce sobre indicadores urbanos.

Dentre os seus principais resultados, os autores observaram uma relação alométrica superlinear () característica entre a quantidade de população residente e o número de crimes sérios, que indica que o crescimento populacional de uma cidade ocorre a custo de um crescimento maior que o proporcional da sua quantidade de crimes. Posteriormente, Melo et al.[Melo et al. 2014] confirmaram esse comportamento para as cidades brasileiras, no entanto encontraram forte evidência quantitativa de que suicídios escalam de forma alométrica sublinear () com população residente.

2 Motivação e Questões de Pesquisa

Grande parte dos trabalhos que buscam compreender a dinâmica das cidades e o impacto que a população exerce sobre indicadores sociais e/ou ambientais relacionados à vida urbana, em especial os que buscam compreender a dinâmica do crime em aglomerados urbanos, fazem-no considerando a existência de uma relação alométrica intercidades explicada pela presença de população residente. Apesar da importância dos resultados apresentados nesses trabalhos, seus impactos no planejamento urbano, mais especificamente no desenvolvimento de políticas públicas, são limitados devido à sua macroescala, diferente de um estudo intracidade que objetiva um entendimento mais profundo das causas que levam a tal comportamento desproporcional. Desta forma, uma abordagem em microescala, baseada no estudo da relação entre população e indicadores urbanos em sub-regiões dentro das cidades, tornou-se a principal motivação desta pesquisa visando ampliar o entendimento acerca dos resultados obtidos. Isso nos levou à formulação da primeira questão de pesquisa desta tese:

- Há relações alométricas entre população e crime dentro de uma cidade?

No percurso de exploração dessa primeira questão de pesquisa, verificou-se que a literatura científica, tanto na criminologia, como nas ciências sociais, enfatizava o papel determinante da movimentação das pessoas no espaço urbano e das relações sociais que nele ocorrem [Cohen e Felson 1979, Clarke e Felson 1993]. Um exemplo marcante é a Teoria das Atividades Rotineiras, proposta por Cohen e Felson [Cohen e Felson 1979], que afirma que crimes, como roubos e furtos, ocorrem pela convergência das rotinas de um agressor motivado a cometer um crime, com uma vítima vulnerável, somada a ausência de um guardião capaz de proteger essa vítima. Essa convergência de rotinas é evidentemente determinada pelo padrão de movimentação das pessoas na cidade. Na verdade, vários outros estudos criminológicos levam em conta a movimentação das pessoas dentro das cidades para explicar a Jornada para Crime (Journey to Crime) [Rengert 2004] e a Vitimização Repetida (Repeat Victimization) [Lauritsen e Quinet 1995], para mencionar alguns. Dependendo do tipo de crime, a movimentação das pessoas pode ter maior ou menor relevância em gerar relações sociais que possam provocar crimes. Em certos crimes ou delitos, as relações de vizinhança seriam mais determinantes o que justificaria considerar os dados da população residente. Em outros, como roubos e furtos, os dados relativos aos deslocamentos das pessoas seriam mais determinantes de relações sociais que levariam a crimes.

Com base nisso, construiu-se a questão de pesquisa , uma especificação da primeira. Visa-se explorar se há relações alométricas em regiões de uma cidade considerando tanto população flutuante como população residente.

- A quantidade de população residente e flutuante é igualmente importante para explicar a quantidade de crimes em diferentes regiões de uma cidade?

3 Desenvolvimento e Resultados

A busca por respostas para as questões de pesquisa elaboradas nesta tese trouxeram desafios técnicos à parte, quais sejam:

  1. [label=()]

  2. Estimar a população flutuante de uma cidade com um nível de granularidade que permitisse verificar a relação entre população e crime em sub-aglomerados dentro da cidade. Para tal efeito, desenvolveu-se um método que permite estimar a movimentação das pessoas baseado em dados de bilhetagem de ônibus e do GPS dos ônibus.

  3. Estimar o tamanho e a forma dos sub-aglomerados urbanos adequados para a identificação de relações alométricas. Desenvolveu-se uma metodologia fazendo uso do algoritmo de aglomeração City Clustering Algorithm (CCA) [Makse et al. 1998, Rozenfeld et al. 2008, Giesen, Zimmermann e Suedekum 2010, Rozenfeld et al. 2011, Duranton e Puga 2013, Gallos et al. 2012, Duranton 2015, Eeckhout 2004].

A aplicação da metodologia desenvolvida se deu a partir de dados georreferenciados de chamadas à polícia para crimes contra o patrimônio e perturbação de sossego alheio, registrados na cidade brasileira de Fortaleza, entre 2014 e 2016. Também foram utilizados dados de população residente, fornecidos pelo Instituto Brasileiro de Geografia e Estatística (IBGE) 111disponível em http://www.ibge.gov.br/. A estimativa de população flutuante foi feita com base em dados de bilhetagem e GPS (Global Positioning System) de ônibus do ano de 2015.

Dentre os resultados obtidos verificou-se que a incidência de crimes contra o patrimônio tem relação alométrica superlinear com a população flutuante em diversas áreas de Fortaleza. Este resultado implica que o aumento do fluxo de pessoas em uma determinada área da cidade acontecerá a custo de uma taxa proporcionalmente maior de crimes na mesma região. Esse comportamento superlinear dentro de aglomerados na cidade amplia o entendimento acerca dos resultados intercidades encontrados em [Bettencourt et al. 2007, Melo et al. 2014], pois, em microescala, é a população flutuante a responsável por criar a relação superlinear evidenciada em macroescala. Também foi encontrada uma relação alométrica superlinear entre população residente e o número de chamadas de perturbação de sossego alheio. Esse resultado mostra que o efeito da influência social deve estar adequadamente correlacionado com a população residente ou flutuante, dependendo do tipo de crime considerado.

Diante do maior entendimento acerca das relações entre população e crime dentro de uma cidade, buscou-se avaliar como esse entendimento pode alterar políticas de segurança pública. Foi desenvolvido um framework com módulos de mineração de dados (de população e crime) e alocação policial. Esse framework permitiu o estudo do impacto que a população, especialmente a flutuante, deveria exercer na atividade de alocação policial, essencialmente devido a constatação de que uma lei de potência conduz a relação entre população flutuante e crimes contra o patrimônio dentro de uma cidade. Foram comparadas duas estratégias de alocação policial, ambas baseadas no modelo de alocação por alta densidade de crimes, que aloca a quantidade de recursos proporcionalmente em função da quantidade de crimes na região. A primeira é uma estratégia convencional de alocação, onde os recursos policiais são distribuídos por unidades administrativas de terreno, normalmente definidas a partir de estatísticas de população residente. A segunda estratégia aloca os mesmos recursos por aglomerados de população flutuante estimados pelo CCA. Observou-se uma diferença substancial entre as quantidades de policiais alocados de acordo com as duas estratégias.

4 Estrutura da tese

Esta tese de doutorado é dividida em seis capítulos, incluindo esta introdução. No capítulo é apresentada a fundamentação teórica que cerca este trabalho. No capítulo será detalhado como foram estimados os padrões de mobilidade dos cidadãos de Fortaleza e como esses padrões quantificam o volume de população flutuante em diversas regiões da cidade. No capítulo será realizada uma discussão a respeito de como uma cidade pode ser dividida para compreensão da dinâmica do crime. Adicionalmente serão apresentados os conjuntos de dados utilizados nesta pesquisa. No capítulo será demonstrado como foram definidas as fronteiras da influência social na cidade, também será explicitado como foram constatadas as relações alométricas entre população e crime. No capítulo será apresentado um exercício de aplicação motivado pela existência de uma relação superlinear entre população flutuante e crimes contra o patrimônio. Especificamente será discutido a respeito de como esse conhecimento poderia ser aplicado à alocação de recursos policiais. Por fim, no capítulo , serão feitas considerações finais acerca deste trabalho e apresentada uma discussão a respeito dos trabalhos futuros identificados.

5 Análise quantitativa para compreensão de fenômenos sociais e urbanos

Métodos quantitativos têm sido aplicados amplamente no contexto da compreensão de fenômenos sociais e urbanos. Enquanto métodos de Regressão Logística têm sido utilizados para compreender o crescimento de cidades [Hu e Lo 2007] e Modelos de Regressão para detectar padrões de mobilidade e de expansão urbana [Sampson e Raudenbush 1999], o método de Regressão Linear (descrito no Apêndice I) tem sido utilizado para estimar correlações entre inúmeros indicadores, provendo explicação quantitativa para diversos fenômenos a nível de escala [Bettencourt et al. 2007, Melo et al. 2014, Oliveira, Andrade e Makse 2014].

Em um contexto mais amplo que apenas a compreensão de fenômenos sociais e urbanos, é observado que Leis de Escala estão presentes na ciência há séculos. Em 1838, [Rameaux e Sarrus 1838] propuseram que a produção de calor em mamíferos era proporcional à potência de 2/3 da sua respectiva massa corporal. Essa hipótese ficou conhecida como a Lei de Superfície e sua verificação experimental foi observada alguns anos depois por [Rubner 1883], que mostrou que a taxa metabólica de cães escalava com a massa corporal elevada a uma potência de 2/3. Em 1932, [Kleiber 1932] mostrou que a taxa metabólica basal e a massa corporal de uma ampla gama de mamíferos estavam relacionadas por uma potência de 3/4 ao invés de 2/3 .Tal resultado ficou conhecido como a Lei de Kleiber e pôs fim à hipótese defendida pela Lei de Superfície, uma vez que os resultados obtidos por Kleiber eram irrefutáveis. Vale ressaltar que a Lei de Kleiber é uma das leis de escala mais famosas da Biologia, uma vez que ela é satisfeita para vários outros seres vivos, de organismos unicelulares até grandes mamíferos [Kleiber et al. 1961, Brown 2000, Simini et al. 2010]. A Figura 1 ilustra a lei de escala observada por Kleiber: o autor descobriu que que a taxa metabólica de diversos organismos escalava com a sua massa corporal elevada a uma potência de 3/4.

Figura 1: Lei de escala observada por Kleiber. Mostrou-se que a taxa metabólica basal e a massa corporal de uma ampla gama de seres vivos estavam relacionadas por uma potência de 3/4.

O termo “alometria” foi usado para descrever leis de escala biológicas gerais durante décadas. Formalmente, uma equação alométrica descreve o crescimento correlacionado de uma variável em função de outra variável , através de uma função , onde é o coeficiente alométrico e é o expoente alométrico. O coeficiente alométrico, , é responsável por dimensionar a diferença de escala entre e . Por exemplo, se e têm crescimento correlacionado, e os valores iniciais de estão na ordem de e na ordem de , assume valor aproximado de . Caso os valores iniciais de e estejam na mesma ordem de grandeza, . Caso os valores iniciais de estejam na ordem de e na ordem de , por exemplo, .

O expoente alométrico, , é responsável por explicar o crescimento de em função de a nível de proporcionalidade. Quando é observado que o crescimento de ocorre de maneira proporcional a , evidenciando uma relação isométrica entre e . indica que tem crescimento maior que o proporcional em função do crescimento de , sendo evidenciada, nesse caso, uma relação alométrica superlinear. Por fim, quando , é observado que cresce a custo de um crescimento menor que o proporcional de , indicando uma relação alométrica sublinear. A Figura 2 ilustra a variação de e para valores de e em escala linear e logarítmica. Nos exemplos gerados com valores de , e sintéticos, o coeficiente alométrico assumiu os valores 0.1 (a-b), 1 (c-d) e 10 (e-f), já o expoente alométrico assumiu valores sublineares, isométricos e superlineares, respectivamente, 0.75 (linhas azuis), 1 (linhas contínuas pretas) e 1.25 (linhas vermelhas). As linhas pontilhadas pretas representam limiares aceitáveis [Bettencourt et al. 2007] para classificar uma relação como isométrica, respectivamente, as linhas pontilhadas superiores e inferiores foram geradas para e .

Figura 2: Variação do coeficiente alométrico e expoente alométrico. Em (a) é ilustrada a variação do expoente alométrico ao fixar o coeficiente alométrico com valor . Em (c) o processo é repetido, no entanto, para . Por fim, em (e), a variação do expoente alométrico é ilustrada para um valor fixo de . E (b), (d) e (f), são ilustradas as mesmas distribuições de (a),(c) e (d) respectivamente, no entanto os valores das distribuições são ilustrados em escala logarítmica.

Nos anos seguintes surgiram os primeiros trabalhos de alometria em estudos não biológicos. Nesses trabalhos foi observado o crescimento de indicadores sociais e urbanos em função de medidas de dimensão de cidades. Uma medida de dimensão de cidade é um atributo que quantifica o tamanho de uma cidade, e.g., população ou características espaciais. Alguns trabalhos investigaram o tamanho da população e a organização interna das cidades, exemplos incluem: o trabalho de Zipf, em 1950, sobre o tamanho das cidades e o número de estabelecimentos de manufatura [Zipf 1950]; o trabalho de Naroll e Bertalanffy, em 1956, sobre o tamanho do maior assentamento em tribos primitivas, o número de especialidades ocupacionais e o número de tipos organizacionais [Naroll e Bertalanffy 1956]; o trabalho de Woldenberg, no ano de 1973, para áreas residenciais, instalações urbanas e uso da terra [Woldenberg 1973]; e o trabalho de Newling que, em 1966, observou uma relação alométrica a partir de dados de densidade populacional urbana [Newling 1966].

No entanto, em 2007, [Bettencourt et al. 2007] trouxeram a alometria em estudos urbanos de volta à discussão acadêmica após extenso período. Em um trabalho realizado com diversas cidades americanas, chinesas e alemãs, os autores descobriram relações alométricas e isométricas entre população residente e diversos indicadores urbanos. Ao utilizar população residente como medida de dimensão de cidades, os autores acabaram por mensurar indiretamente o volume de influência social exercido sobre as cidades. Já as relações alométricas e isométricas encontradas dimensionaram o papel que essa influência social tem sobre indicadores urbanos a nível de escala. De forma análoga aos trabalhos realizados na biologia, os autores mensuraram essa relação por uma função do tipo , no entanto, no trabalho de Bettencourt et al., é a quantidade de população residente e corresponde a quantidade de um indicador urbano. Cada ponto plotado nos gráficos de dispersão de Bettencourt et al. correspondia a uma cidade. Os autores delimitaram as cidades pelas suas fronteiras administrativas.

Dentre os principais resultados obtidos por [Bettencourt et al. 2007], destacam-se as observações de que as grandes cidades potencializam a produção de inovação e de novas patentes. Observou-se uma relação alométrica superlinear entre população residente e quantidade de novas patentes e de invenções, em outras palavras, quando a população de uma cidade dobra, a quantidade de novas patentes e invenções mais do que dobra. Os autores mostraram também que existe uma relação alométrica sublinear entre população residente e, por exemplo, a quantidade de postos de gasolina. Nesse ponto os autores apontam que as grandes cidades alcançam eficiência similar a de sistemas biológicos (Lei de Kleiber), devido a constatação de que se uma cidade dobra a sua população é necessário menos que o dobro de postos de gasolinas para atender a sua demanda. Por fim, ainda foi observado que alguns indicadores se relacionavam de forma isométrica com a população, o aumento dos indicadores urbanos lineares são proporcionais ao tamanho da população das cidades refletindo as necessidades individuais comuns de cada ser humano, como o consumo de água, o número de empregos e o número de residências. A Tabela 1 ilustra as relações estatísticas observadas por Bettencourt et al.

Y C.I. Observações País Ano
Novas patentes US 2001

Inventores
US 2001

Empregos de P&D
US 2002

Empregos supercriativos
US 2003

Estabelecimentos de P&D
US 1997

Empregos de P&D
China 2002

Salários
US 2002

Depósitos bancários
US 1996

PIB
China 2002

PIB
EU 1999-2003

PIB
Alemanha 2003

Consumo elétrico total
Alemanha 2002

Novos casos de AIDS
US 2002-2003

Crimes Sérios
US 2003


Casas
US 1990

Empregos
US 2001

Consumo elétrico doméstico
Alemanha 2002

Consumo elétrico doméstico
China 2002

Consumo de água doméstico
China 2002


Postos de gasolina
US 2001

Vendas de gasolina
US 2001

Comp. da fiação elétrica
Alemanha 2002

Superfície da estrada
Alemanha 2002

Tabela 1: Relações alométricas e isométricas observadas por Bettencourt e coautores. Retirado de [Bettencourt et al. 2007].

O trabalho de [Bettencourt et al. 2007] teve ampla divulgação na comunidade científica e meios de imprensa. Um dos fatos mais discutidos a respeito desse trabalho foi a relação superlinear encontrada entre população residente e crimes sérios, com expoente alométrico , em cidades dos Estados Unidos no ano de 2003. Posteriormente, uma relação alométrica do mesmo tipo, entre população residente e crimes violentos, foi observada também para cidades brasileiras, com expoente alométrico [Bettencourt et al. 2010].

Ainda sobre relações superlineares entre população e crime, [Melo et al. 2014] encontram forte evidencia quantitativa de que homicídios em cidades brasileiras escalam, com expoente , de maneira superlinear com população residente. Os autores observaram ainda a existência de uma relação sublinear entre população residente e suicídios, com expoente alométrico , e relação isométrica entre população residente e acidentes de trânsito (). Foram utilizadas as fronteiras administrativas definidas pelo governo para delimitar as cidades brasileiras. Na discussão do trabalho os autores explicam que a influencia social potencializa a propagação de crimes no espaço urbano, embora também apoie para que ocorram menos suicídios. A Figura 3 ilustra resultados reproduzidos a partir do trabalho de [Melo et al. 2014].

Figura 3: Relações alométricas e isométricas observadas por Melo e coautores. (a) Relação alométrica superlinear entre população residente e homicídios (). (b) Relação isométrica entre população residente e acidentes de trânsito (). (c) Relação alométrica sublinear entre população residente e suicídios (). Em todas as figuras os círculos pretos representam cidades brasileiras e as retas vermelhas representam regressões lineares aplicadas aos dados. As linhas contínuas azuis foram estimadas pelo método Nadaraya-Watson [Nadaraya 1964, Watson 1964] e as linhas tracejadas azuis delimitam o intervalo de confiança de 95% estimado por bootstrap [Racine e Li 2004, Li e Racine 2004]. Ambos os eixos estão em escala logarítmica.

Trabalhos recentes demonstraram que unidades administrativas de terreno (e.g. bairros, setores censitários ou fronteiras municipais) são imprecisas para compreender fenômenos urbanos, principalmente porque estas são definidas com restrições que buscam simplificar atividades de censo, como normalizações de suas fronteiras por estatísticas de população residente [Oliveira, Andrade e Makse 2014, Arcaute et al. 2015, Cottineau et al. 2016]. Existem diferentes métodos para reconstruir sistemas urbanos, por exemplo através do crescimento populacional [Rozenfeld et al. 2008, Giesen, Zimmermann e Suedekum 2010, Rozenfeld et al. 2011, Duranton e Puga 2013, Gallos et al. 2012, Duranton 2015, Eeckhout 2004], ou métodos que utilizam a agregação por percolação e limitação de difusão [Makse et al. 1998, Makse, Havlin e Stanley 1995, Murcio, Sosa-Herrera e Rodriguez-Romo 2013, Fluschnik et al. 2014].

Recentemente, [Arcaute et al. 2015] desenvolveram um framework para definir cidades além de suas fronteiras administrativas. A parte principal desse framework é um algoritmo de aglomeração que utiliza a densidade populacional como parâmetro principal, pois esta é uma propriedade intrínseca de espaços urbanizados. Os autores definiram o parâmetro de densidade de população, , para situar-se dentro do intervalo [1-40], tendo sido esse parâmetro mensurado em pessoas por hectare. Para cada limiar inteiro no intervalo, foram agrupadas todas as unidades de aglomeração adjacentes com densidade tal que . Se uma unidade de aglomeração tiver uma densidade , mas é cercada por outra unidade de modo que, para cada unidade adjacente (), , a unidade também é incluída no aglomerado. Uma das principais limitações desse algorítimo é que ele só produz aglomerados com superfície contínua. Dentro do intervalo de variação do parâmetro, os autores estimaram 40 divisões diferentes de sistemas de cidades para Inglaterra e País de Gales. A Figura 4 ilustra o efeito da variação de na formação de aglomerados urbanos em um país inteiro.

Figura 4: Efeito da variação do parâmetro de densidade populacional na formação de aglomerados urbanos. Adaptado de [Arcaute et al. 2015].

Um ano depois, [Arcaute et al. 2016] também utilizaram percolação [Stauffer e Aharony 1994] para escolher o melhor valor de na definição dos aglomerados. Os autores mediram o tamanho do maior aglomero enquanto variavam em busca de uma transição de fase [Stanley 1971]. Mais precisamente, os autores verificaram em que momento o maior aglomerado agregaria o segundo maior aglomerado, momento esse dito como o ponto crítico do sistema, que ocorre em uma transição de fase. Comumente é escolhido o valor do parâmetro de agregação anterior a esse ponto crítico. A Figura 5 ilustra o processo de percolação em uma agregação sistemática de unidades administrativas de terreno da cidade de Fortaleza.

Figura 5: Percolação em unidades administrativas de terreno da cidade de Fortaleza. É ilustrado o crescimento do maior aglomerado em função do incremento de um limiar de distância (). Nos mapas embutidos, cada cor representa um aglomerado construído. Foi utilizado o algoritmo de aglomeração City Clustering Algorithm (CCA) para agrupar setores censitários da cidade de Fortaleza. É identificada uma transição de fase ao incrementar o valor de de 270 para 280 metros, momento em que ocorre o maior salto no tamanho do maior agregado. O tamanho do maior agregado foi mensurado a partir do total de setores censitários agregados no mesmo. O CCA ainda possui um limiar de densidade populacional (), neste experimento foi utilizado pessoas por .

Em 2014, [Oliveira, Andrade e Makse 2014] investigaram de forma mais profunda a construção de aglomerados urbanos em um estudo com cidades americanas. Foi utilizado o City Clustering Algorithm (CCA) para definir as fronteiras das cidades além dos seus limites administrativos. Uma cidade do CCA é definida a partir de dois parâmetros, um limiar de densidade populacional, , e outro de distância, . Os autores estudaram o efeito que o crescimento populacional tinha sobre os altos índices de emissão de gases, mais precisamente foram estudadas as consequências do crescimento urbano e seus impactos no meio ambiente. É intensamente debatido se grandes cidades podem ser consideradas ambientalmente “verdes”, ou seja, se suas produtividades podem ser associadas a baixos índices de emissão de poluentes [Bento, Franco e Kaffine 2006, Kahn 2007, Brownstone e Golob 2009, Dodman 2009, Puga 2010, Glaeser e Kahn 2010]. Alguns estudos relatam que o nível de comutação das pessoas, isto é, o processo que as pessoas fazem diariamente para ir de casa para o trabalho e do trabalho para casa, tem uma grande contribuição para a relação entre as emissões de poluentes e tamanho da cidade [Bento, Franco e Kaffine 2006, Brownstone e Golob 2009, Glaeser e Kahn 2010]. Como consequência, as cidades compactas seriam mais verdes, devido à atenuação da duração do percurso das pessoas durante a comutação. Oliveira et al. [Oliveira, Andrade e Makse 2014] mostraram que as relações alométricas entre as populações de cidades nos Estados Unidos e suas respectivas emissões de dióxido de Carbono (CO) são superlineares, concluindo que cidades grandes são menos verdes, isto é, poluem proporcionalmente mais do que cidades pequenas. Os autores tiveram como principal resultado a estimativa do expoente alométrico . A Figura 6 ilustra um resultado reproduzido a partir do trabalho de Oliveira et al. [Oliveira, Andrade e Makse 2014].

Figura 6: Relação alométrica superlinear observada por Oliveira e coautores. Foi encontrado expoente alométrico entre população residente e e emissão de gás carbônico em cidades americanas. Os círculos pretos representam cidades americanas e a reta vermelha ilustra uma regressão linear aplicada aos dados. A linha contínua azul foi estimada utilizando o método Nadaraya-Watson [Nadaraya 1964, Watson 1964] e as linhas tracejadas azuis delimitam o intervalo de confiança de 95% estimado por bootstrap [Racine e Li 2004, Li e Racine 2004]. Ambos os eixos estão em escala logarítmica.

6 Crime e mobilidade humana: uma visão sociológica e criminológica

Ao longo dos anos, foram elaboradas uma série de teorias com objetivo de explicar a dinâmica da criminalidade. A teoria da Escolha Racional, por exemplo, parte do princípio de que as ações humanas são ações racionais, fruto de decisões que envolvem a consideração de diversos fatores. Neste contexto, a decisão de praticar um crime envolve a avaliação dos riscos e benefícios decorrentes de diversos fatores, alguns deles presentes no ambiente onde o indivíduo pretende consumar o ato criminoso, ainda que essa avaliação seja limitada pelo não-conhecimento de todos os riscos envolvidos [Centro, Anselin et al. 2000].

Outra teoria de grande relevância, especialmente para este trabalho, denominada teoria das Atividades Rotineiras, foi proposta por Cohen e Felson [Cohen e Felson 1979] em 1979. Os autores julgam que as atividades diárias criam a convergência no tempo e espaço de três elementos necessários para que um crime ocorra: um agressor motivado; um alvo vulnerável; e a ausência de um guardião capaz. Um agressor motivado é fruto de uma desorganização social onde, a partir de oportunidades, indivíduos cometem crimes com objetivo de maximizar seus lucros. Alvos vulneráveis podem ser pessoas, locais e/ou produtos. Se o crime é um arrombamento, por exemplo, o alvo adequado deve ser um local em que se acredita haver um objeto de valor. Por outro lado, se o crime é um roubo a pessoa, o alvo adequado será um indivíduo que é percebido carregando objetos de valor, desprotegido e, possivelmente, sem condições de reagir. Por fim, um guardião capaz é uma pessoa ou equipamento que desencoraje a prática do crime. Esse guardião pode ser formal (policial ou sistemas de segurança) ou informal (testemunhas). A Figura 7 ilustra o modelo gráfico clássico dessa teoria.

Motivados pela grande dificuldade que os estudos contemporâneos apresentavam para explicar as mudanças anuais nas tendências da taxa de criminalidade nos Estados Unidos, essencialmente no período pós Segunda Guerra, os autores iniciaram uma interessante discussão a respeito de como o incremento nas oportunidades de desfrutar dos benefícios da vida também aumentam a oportunidade de violações predatórias. Por exemplo, os automóveis proporcionam liberdade de movimento aos infratores, bem como aos cidadãos comuns e oferecem alvos vulneráveis para que roubos ocorram. A matrícula na faculdade, a participação da força de trabalho feminina, a urbanização, a suburbanização, as férias e os novos bens duráveis eletrônicos oferecem várias oportunidades de escapar dos confins da família enquanto aumentam o risco de vitimização predatória.

A teoria ainda argumenta que as oportunidades disponíveis são um componente importante na construção de um crime. Escolhas no estilo de vida por parte de potenciais vítimas podem criar ou reduzir oportunidades de cometer crimes para o criminoso motivado.

Figura 7: Modelo gráfico da Teoria das Atividades Rotineiras. São ilustrados círculos que simbolizam as rotinas de três agentes. A teoria afirma que um crime ocorre pela convergência espaçotemporal (interseção dos círculos) das rotinas desses três agentes: Um agressor motivado; uma vítima desprotegida; e a ausência de um guardião capaz de impedir a transgressão.

Alguns conceitos da teoria das Atividades Rotineiras foram aplicados por Brahtingham e Brahtingham na elaboração da teoria dos Padrões Criminais [Anselin, Varga e Acs 2000]. Os autores argumentam que a relação entre ambiente e crime não deve ser avaliada sobre uma perspectiva espacial simples. Existem características do ambiente que são potencialmente favoráveis à ocorrência de eventos criminais e são percebidas por delinquentes e associadas à sua motivação pessoal para cometer crimes, essencialmente, no contexto de seus deslocamentos cotidianos. Através da interação entre percepção, cognição e comportamento, o potencial criminoso constrói padrões criminais mentais para suas ações, ajudando-o a avaliar um tipo particular de objeto, lugar ou situação, num contexto que os autores denominam Mosaico Urbano. Por esse motivo, a Criminologia Ambiental (Environmental criminology), como esse campo de estudo é chamado, constitui uma abordagem que envolve conhecimentos de diversas áreas [Brantingham e Brantingham 1981].

A teoria das Janelas Quebradas explica o efeito normativo e sinalizador da desordem urbana e do vandalismo sobre o crime e o comportamento antissocial. A teoria afirma que a manutenção e monitoramento de ambientes urbanos para prevenir pequenos crimes, como vandalismo e uso excessivo de bebida alcoólica, ajuda a criar uma atmosfera de ordem e legalidade, impedindo assim que pessoas que trafegam pelo espaço urbano venham a cometer mais atos ilegais. A teoria foi introduzida em 1982 pelos sociólogos James Q. Wilson e George L. Kelling [Wilson e Kelling 1982, Kelling e Coles 1997], desde então tem sido objeto de grande debate tanto no âmbito das ciências sociais quanto no âmbito da esfera pública. A teoria foi utilizada durante muitos anos como motivação para várias reformas na política criminal norte americana.

Antes mesmo da introdução dessa teoria, o psicólogo Zimbardo organizou um experimento testando o seu conceito principal em 1969 [Zimbardo 1969]. Zimbardo utilizou um automóvel sem placa de licença e o estacionou ocioso em um bairro onde o espaço urbano estava deteriorado e um segundo automóvel, na mesma condição, em outro bairro, onde não haviam sinais de deterioração. O primeiro carro foi atacado poucos minutos depois de seu abandono. Zimbardo observou que os primeiros praticantes de vandalismo a chegar eram uma família - um pai, uma mãe e um filho - que removeram o radiador e a bateria do veículo. Dentro de vinte e quatro horas de seu abandono, tudo de valor tinha sido retirado do veículo. Depois disso, as janelas do carro foram quebradas, estofados rasgados, e as crianças estavam usando o carro como um playground. Ao mesmo tempo, o segundo veículo permaneceu intacto por mais de uma semana até que Zimbardo se aproximou do veículo e o despedaçou deliberadamente com uma marreta. Logo depois observou-se que outras pessoas passaram também e cometer atos de vandalismo com o veículo. Zimbardo ainda observou que a maioria dos adultos vândalos, em ambos os casos, eram principalmente pessoas bem vestidas e aparentemente indivíduos respeitáveis, muitos vezes vindos de outras regiões da cidade. Acredita-se que, em um bairro cujo o espaço urbano é deteriorado, onde é predominante a presença de propriedades abandonadas, por exemplo, roubos são mais prevalentes e vandalismos ocorrem muito mais rapidamente. Eventos semelhantes podem ocorrer em qualquer comunidade civilizada quando as barreiras comunais - o sentido de respeito mútuo e obrigações de civilidade - são apequenadas por ações que sugerem apatia.

Após a criação da teoria das Janelas Quebradas e diante da constatação recente de que os estilos de vida das pessoas influenciam na ocorrência de crimes [Cohen e Felson 1979], em 1984 [Brantingham e Brantingham 1984] foi fortalecida a necessidade de investigar a movimentação das pessoas. Na criminologia é estabelecido que os criminosos não se envolvem em crimes em áreas distantes do seu local de residência [Brantingham e Brantingham 1984]. É extensa a lista de estudos que têm, consistentemente, demonstrado que, em média, os infratores residem a uma distância de duas milhas das áreas onde cometem seus crimes [Groff e McEwen 2012]. Esse fenômeno é descrito como Degradação na Distância do Crime, pois na medida que a distância entre a residência de um agressor e um local - que propicie oportunidades de cometer crimes - aumenta, o número de crimes cometidos pelo infrator diminui. De acordo com a pesquisa, esse padrão é resultado da relutância dos infratores em viajar para áreas que não conhecem [Brantingham e Brantingham 1981], pois as mesmas proporcionariam um incremento nas chances de apreensão. Embora destinado a explicar padrões de mobilidade dos criminosos, a degradação na distância do crime encontrou também alguma validade na explicação dos padrões de vitimização. Estudiosos que examinaram os padrões de mobilidade das vítimas, de fato, descobriram que a vitimização (semelhante aos infratores) tende a ocorrer em áreas próximas da residência do indivíduo vítima [Bullock 1955, Caywood 1998, Messner e Tardiff 1985].

A partir da degradação na distância do crime, Pizarro et al. [Pizarro, Corsaro e Yu 2007] decidiram examinar os padrões de mobilidade das vítimas de homicídios e dos infratores. A motivação para tal estudo veio a partir da observação de que existiam algumas limitações na literatura até então, pois poucos estudos examinavam os padrões de mobilidade das vítimas e dos infratores [Bullock 1955, Caywood 1998, Groff e McEwen 2012, Messner e Tardiff 1985, Pokorny 1965, Rand 1986, Tita e Griffiths 2005]. Basicamente, Pizzarro et al. estavam interessados em responder três questões de pesquisa relacionadas a homicídios:

  1. [label=()]

  2. A distância percorrida por suspeitos e vítimas a partir de suas respectivas residências para o local do incidente varia de acordo com o fato que motivou o homicídio?

  3. A razão pela qual as vítimas e suspeitos de homicídio viajam para o local do incidente variam de acordo com o tipo de motivo de homicídio?

  4. Que características da vítima e suspeito predizem significativamente a distância percorrida da residência para a localização do incidente?

As análises dos autores sobre os dados da unidade de homicídios do Departamento de Polícia de Newark, mostraram que existem diferenças estatisticamente significativas entre os tipos de homicídios em termos de duração das viagens das vítimas e dos suspeitos.

Ainda a respeito de teorias criminológicas, a teoria da Vitimização Repetida (Repeat Victimization) [Lauritsen e Quinet 1995] também é de grande relevância. De acordo com muitas das suas definições, na repetição da vitimização, ou revitimização, o mesmo tipo de incidente criminal é experienciado pela mesma vítima, - ou virtualmente a mesma – ou alvo, dentro de um período de tempo específico. Um alvo considerado "virtualmente"o mesmo, pode ser representado por duas ou mais pessoas distintas, que estão conectadas por um mesmo contexto, como por exemplo, trafegar por um determinado local, portando um mesmo objetivo de valor, na mesma faixa de horário. Uma característica crítica e consistente da repetição da vitimização é que as infrações repetidas ocorrem rapidamente - muitas repetições ocorrem dentro de uma semana da ofensa inicial, e algumas até ocorrem dentro de 24 horas. Um estudo inicial sobre essa teoria mostrou o maior risco de um roubo repetido foi durante a primeira semana após um roubo inicial [Wartell e Vigne 2004].

Em 1995, Lauritsen e Quinet [Lauritsen e Quinet 1995] expandiram os conhecimentos existentes sobre a vitimização, descrevendo os padrões temporais de risco e desenvolvendo e testando modelos explicativos do vínculo entre os riscos passados e futuros. As análises baseadas em dados de painel do National Youth Survey suportam a dependência do estado e as interpretações de heterogeneidade da correlação no risco ao longo do tempo. Em outras palavras, a vitimização prévia prevê o risco futuro, em parte, porque altera algo sobre o indivíduo, e porque indica uma propensão não mensurada para a vitimização que persiste ao longo do tempo. As implicações teóricas desses achados, incluindo a viabilidade de uma perspectiva de rotulagem da vítima, foram discutidas no trabalho.

Mais recentemente, em 2008, Daigle et al. [Daigle, Fisher e Cullen 2008] perceberam um grau significativo de repetição em crimes de violência contra mulheres americanas em uma análise sobre dois conjuntos de dados de nível nacional. Os autores observaram que uma pequena proporção de mulheres da faculdade são vítimas de uma grande proporção de violências sexuais. Também foi constatado que as mulheres são mais propensas a sofrer uma repetição de vitimização sexual do que repetir incidentes de violência. Observou-se que a repetição da vitimização tende a acontecer no mesmo mês da vitimização inicial, e o próximo tipo de vitimização mais provável é, de longe, do mesmo tipo. Os autores ainda mostram que, entre as mulheres vitimadas, a repetição da vitimização é uma experiência comum, atingindo entre 14% e 26% delas durante um ano letivo. De maneira adicional é mostrado que a repetição da vitimização ocorre rapidamente, com o risco de outro pico de vitimização no tempo imediatamente após a vitimização inicial e, em seguida, diminuindo ao longo do tempo. Por fim, os autores reforçam que a repetição da vitimização, é pouco compreendida e não é sistematicamente abordada por programas de prevenção sexual ou de violência.

7 Estimação de padrões de mobilidade

Recentemente se percebeu um considerável crescimento na quantidade de artigos científicos que fazem uso de dados de mobilidade humana para estudar os mais diversos fenômenos. Para prever, desde a disseminação de vírus humanos e eletrônicos, até fazer planejamento urbano e gerenciamento de recursos em comunicação móvel, mostrou-se ser fundamental a utilização de dados precisos de mobilidade. Apesar de ainda ser limitado o acesso a esses dados, devido a, essencialmente, questões de privacidade, o avanço tecnológico e, principalmente, o considerável incremento no número de sensores digitais, permite que, nos dias de hoje, alguns cientistas estudem a mobilidade das pessoas. Atualmente, observa-se que as informações mais detalhadas a respeito desse tipo de dado são coletadas por operadoras de telefonia móvel [Gonzalez, Hidalgo e Barabasi 2008, Song et al. 2010, Hidalgo e Rodriguez-Sickert 2008, Eagle, Pentland e Lazer 2006, González, Lind e Herrmann 2006, Eagle, Pentland e Lazer 2009, Lambiotte et al. 2008], no entanto são inúmeros os trabalhos que utilizam dados de survey [Liang et al. 2013] e bilhetagem eletrônica [Gordillo 2006, Caminha et al. 2016, Caminha et al. 2016] para compreender fenômenos relacionados à mobilidade das pessoas.

A respeito da possibilidade de se inferir padrões de mobilidade através de dados de dispositivos móveis, Gonzalez et al. [Gonzalez, Hidalgo e Barabasi 2008], em 2008, estudaram a trajetória de 100000 usuários de telefones celulares anônimos, cuja posição foi monitorada por um período de seis meses. Foi constatado que, em contraste com as trajetórias aleatórias preditas por modelos como Lévy Flight e Random Walk [Brockmann, Hufnagel e Geisel 2006], as trajetórias humanas mostram um alto grau de regularidade temporal e espacial, sendo cada indivíduo caracterizado por uma distância de viagem independente do tempo e uma probabilidade significativa de retornar a alguns locais altamente frequentados. Os padrões individuais de viagem convergem em uma única distribuição de probabilidade espacial, indicando que, apesar da diversidade dos dados históricos de viagem, os seres humanos seguem padrões reproduzíveis simples. Os autores argumentam que esta semelhança inerente nos padrões de viagem poderia impactar em todos os fenômenos impulsionados pela mobilidade humana, tais como prevenção de epidemias e planejamento urbano.

O trabalho de Gonzalez et al. [Gonzalez, Hidalgo e Barabasi 2008] inspirou outras produções científicas, sempre objetivando prever a mobilidade das pessoas. Nesse aspecto, destaca-se o trabalho de Chaoming Song et al. [Song et al. 2010] que exploraram os limites da previsibilidade na dinâmica do deslocamento humano. Os autores estudaram padrões de mobilidade de usuários de telefones celulares anônimos e ao medir a entropia da trajetória de cada indivíduo, foi encontrado que é possível potencialmente prever 93% da mobilidade de usuários utilizando dados históricos de telefonia móvel.

Após se perceber que é possível identificar padrões claros de deslocamento a partir de dados de telefonia móvel, uma série de pesquisadores buscaram compreender as relações sociais de indivíduos a partir de padrões de mobilidade. Nesse aspecto é relevante o trabalho de Hidalgo e Rodriguez (2008) [Hidalgo e Rodriguez-Sickert 2008], que definiram e mediram a persistência de laços de relacionamento em um período de um ano usando dados de atividade de todas as chamadas de voz realizadas por uma operadora de telefonia móvel de um país industrializado. Foi construída uma rede de relacionamentos e mostrado que a persistência dos laços depende de características topológicas dessa rede. Mais precisamente, os autores mostraram que os laços persistentes tendem a ser recíprocos e são mais comuns para pessoas com baixo grau [Albert e Barabási 2002] e coeficiente de agrupamento alto [Holland e Leinhardt 1971].

Ainda em 2008, Lambiotte et al. [Lambiotte et al. 2008], detectaram um padrão espacial de relacionamento entre pessoas a partir de dados de mobilidade. Mais precisamente, os autores mostraram que a probabilidade de dois usuários manterem uma relação, segue um modelo de gravidade [Anderson e Wincoop 2003], ou seja, diminui como , onde é a distância entre esses usuários. Foram utilizados dados de uma empresa de telefonia móvel, que possuía até o momento da pesquisa 2.5 milhões de clientes e 810 milhões de comunicações (chamadas telefônicas e mensagens de texto) durante um período de seis meses.

Em 2009, Eagle et al. [Eagle, Pentland e Lazer 2009] formularam a seguinte hipótese: Os dados coletados de telefones celulares têm o potencial de fornecer uma visão sobre a dinâmica dos relacionamentos das pessoas, revelando organizações, comunidades e, potencialmente, sociedades. Os autores validaram sua hipótese mostrando que é possível inferir, com precisão, 95% das amizades com base apenas nos dados de operadoras de telefonia móvel. O autores validaram as amizades inferidas comparando seus resultados com dados de relatórios auto declarados dos usuários. Foi ainda mostrado que os pares de amigos demonstram padrões temporais e espaciais independentes de sua proximidade física e padrões de chamada.

Dados de telefonia móvel são possivelmente os mais precisos para estimar padrões de mobilidade. Diante da dificuldade de obter esse tipo de dado, uma série de pesquisadores buscaram estudar dados de GPS (Global Positioning System) e bilhetagem (cobrança automatizada) de ônibus, com o objetivo, muitas vezes, de estimar os mesmos padrões de movimentação das pessoas. Nesse contexto, Gordillo [Gordillo 2006] analisou dados de bilhetagem e GPS de ônibus em 2006. O resultado da sua pesquisa é uma metodologia para descobrir as origens e destinos específicas para diferentes períodos de tempo, dias da semana e estações do ano de cidadãos de uma grande metrópole. Uma das grandes vantagens de se estimar padrões de mobilidade a partir da análise de dados de cobrança automática é que, essas análises, devem ser capazes de obter uma visão detalhada, contínua e precisa do comportamento da mobilidade das pessoas, por uma fração do custo normalmente obtido em pesquisas baseadas em coleta de dados via survey [Lam e Lo 1991, Remya e Mathew 2013].

Ainda a respeito do problema de estimativa de origens e destinos, enquanto Remya e Mathew (2013) [Remya e Mathew 2013] utilizaram redes neurais artificiais [Wang 2003, Park et al. 1991, Hsu, Gupta e Sorooshian 1995] para compreender a demanda de redes de ônibus hipotéticas, Hua-ling (2007) [Hua-ling 2007] analisou o impacto de congestionamentos de trânsito na estimativa da dinâmica das origens e destinos das pessoas. Hua-ling fez uso de dados de ocupação de vias e avaliou os trechos de uma cidade e o seu grau de ocupação para propor uma metodologia capaz de estimar as origens e destinos mais frequentes da cidade.

Em 2016, Caminha et al. [Caminha et al. 2016] utilizaram dados de bilhetagem e GPS de ônibus para estimar origens e destinos de usuários do sistema de ônibus de uma grande metrópole. Em um processo de caracterização da rede de ônibus baseado no cálculo de métricas de redes complexas [Albert, Jeong e Barabási 2000, Strogatz 2001, Albert e Barabási 2002], os autores sugeriram a criação de linhas expressas para levar passageiros entre partes de rede que aparentemente possuíam gargalos. Ainda em 2016, os mesmos autores, em outro trabalho [Caminha et al. 2016], utilizaram as origens e destinos estimadas para reconstruir as rotas dos usuários de ônibus. Em um estudo mais profundo a respeito da oferta e da demanda de uma rede de ônibus, os autores apresentaram uma metodologia para encontrar gargalos microscópicos e desequilíbrios entre oferta e demanda em uma rede de transporte público. Na discussão final dos trabalhos, os autores ainda alertam para o potencial que a reconstrução das rotas dos usuários tem na compreensão da dinâmica de espalhamento de epidemias, como a dengue [Nogueira et al. 2001].

A respeito disso, é digno de destaque que a mobilidade humana também tem sido utilizada para explicar a propagação de vírus humanos e eletrônicos. Colizza et al. [Colizza et al. 2007] mostraram que a avaliação do transporte aéreo é crucial no cálculo da probabilidade de ocorrência de surtos globais de doenças. Já Hufnagel et al. [Hufnagel, Brockmann e Geisel 2004] apresentaram um modelo probabilístico que descreve a disseminação mundial de doenças infecciosas e demonstram que uma previsão da propagação geográfica de epidemias é de fato possível. Seu modelo combina uma dinâmica de infecção estocástica local entre indivíduos com transporte estocástico em uma rede mundial. Os autores levaram em conta o tráfego nacional e internacional de aviação civil. Wang et al., em 2009, [Wang et al. 2009], modelaram a mobilidade de usuários de telefones celulares para estudar os padrões de propagação fundamentais que caracterizam um surto de vírus eletrônico móvel. Os autores descobriram que, embora os vírus bluetooth possam chegar a todos os aparelhos suscetíveis com o tempo, eles se espalham lentamente devido à mobilidade humana, oferecendo amplas oportunidades para implantar um software antivírus.

Em 2011, Andresen [Andresen 2011] introduziu o conceito de população ambiente, que é uma estimativa média, por período de 24 horas, da quantidade de pessoas em uma determinada área. Andresen utilizou dados do Laboratorio Nacional de Oak Ridge para estimar uma taxa denominada população em risco. A taxa em questão mensurava o risco que vítimas corriam ao estar em um determinado local de uma grande metrópole. Esse risco era maior ou menor dependendo do tipo de crime que era correlacionado com essa população ambiente.

Em 2015, Malleson e Andresen [Malleson e Andresen 2015] publicaram um artigo de grande relevância, especialmente para este trabalho. Os autores se interessaram por estudar a taxa de criminalidade, uma estatística usada para resumir o risco de eventos criminosos. Motivados por trabalhos anteriores que mostraram que a escolha do denominador apropriado para medir essa taxa não é trivial [Andresen 2011] e pelo fato de que população residente é a medida populacional mais comumente utilizada para mensurar risco, Malleson e Andresen mostraram que população flutuante é mais adequada para mensurar o risco para alguns tipos de crimes, e.g., roubos e furtos.

Malleson e Andresen utilizaram dados crowdsourced - especificamente, da rede social Twitter - na cidade de Leeds (Inglaterra) para medir a população em risco considerando o crimes violentos. Diante da dificuldade constatada de se obter dados reais de mobilidade humana, os autores tiveram como primeira contribuição mostrar que população flutuante pode ser estimada indiretamente a partir de dados de redes sociais. A principal contribuição dos autores foi mostrar que diferentes padrões espaciais de taxas de criminalidade surgem quando se utilizam duas medidas de população em risco diferentes: a população residente (medida pelo censo 2011 do Reino Unido); e a população flutuante (medida pelo número de mensagens do Twitter). Possivelmente seu resultado mais relevante esteja relacionado a análise do centro comercial da cidade de Leeds. Embora esta área tenha um grande volume de crimes violentos, a mesma não exibe uma taxa estatisticamente significativa quando a população flutuante é usada para medir a população em risco. Consequentemente, apesar do alto volume de crimes violentos, não há uma elevação estatisticamente significativa no risco dessa região. Os autores ainda reforçam que nenhuma conclusão desse tipo, em relação ao centro da cidade, teria sido alcançada utilizando apenas a população residente.

8 Contexto

O sistema de mobilidade urbana de uma grande cidade é composto por várias redes interligadas, como redes de metrô, ônibus, bicicletas, táxis e veículos particulares. Os ônibus são o principal meio de transporte para a maioria dos habitantes da cidade de Fortaleza, sendo utilizados por pessoas diariamente. De acordo com o IBGE 111http://www.cidades.ibge.gov.br/v3/cidades/municipio/2304400, Fortaleza tem carros e motocicletas. Supondo que o limite superior para o deslocamento diário utilizando carros e motocicletas seja de (), o total de deslocamentos em Fortaleza é . Portanto, o sistema de ônibus representa pelo menos da mobilidade urbana dentro de Fortaleza e são conhecidas as rotas de pelo menos do total de deslocamentos. Levando em conta esse fato, é assumido que a mobilidade urbana dentro da cidade pode ser representada pelo uso do sistema de ônibus. Assim, as trajetórias dos usuários de ônibus serão utilizadas para inferir o volume de população flutuante nos diferentes pontos da cidade.

9 Conjuntos de dados de mobilidade

Para compreender o fluxo de pessoas em toda a cidade, foram utilizados quatro conjuntos de dados espaço-temporais relacionados à rede de ônibus de Fortaleza, que são:

  1. [label=()]

  2. Paradas de ônibus.

  3. Rotas de ônibus.

  4. Global Positioning System (GPS).

  5. Bilhetagem de ônibus (Programa do Bilhete Único).

No total, Fortaleza possui 4783 paradas de ônibus atendidas por 2034 ônibus que circulam em 359 rotas (linhas de ônibus) diferentes. Cada ônibus da cidade é equipado com um sistema de GPS, que registra a posição de ônibus em intervalos de aproximadamente trinta segundos. Em um dia útil, são registrados cerca de quatro milhões de coordenadas geográficas para os ônibus de Fortaleza.

O modelo de transporte integrado adotado pela prefeitura de Fortaleza, nomeado Bilhete Único, permite que os usuários registrados façam uma transferência de ônibus em qualquer lugar da cidade, contanto que seja dentro de duas horas desde a última validação de seu cartão. O processo de validação do Bilhete Único é entendido como o ato de o usuário deslizar o seu cartão no leitor eletrônico localizado próximo a catraca do ônibus ou a catraca de um terminal de ônibus. Geralmente, tal procedimento acontece no início da viagem, já que a catraca está próxima à entrada do ônibus em Fortaleza. Em um dia útil ocorrem, em média, 1.2 milhões de validações do Bilhete Único.

Todos os conjuntos de dados de mobilidade utilizados referem-se a duas semanas do mês de março de 2015, especificamente do dia 4 ao dia 18 de março. A seguir serão detalhadas estimativas de mobilidade dos usuários, buscando-se estimar um comportamento médio de mobilidade de um dia útil na cidade de Fortaleza. Nos dias úteis a rede de ônibus tem seu pico de uso [Caminha et al. 2016, Caminha et al. 2016, Furtado et al. 2017].

10 Estimativa e validação de uma matriz origem-destino

Foi estimada uma matriz de origem-destino dos usuários de ônibus de Fortaleza através de heurísticas retiradas do estado da arte de Engenharia do Transporte. É assumido que o ponto de origem de um usuário é o local da sua primeira validação diária [Gordillo 2006, Lam e Lo 1991]. Utilizando dados do dia onze de março, para cada usuário foi recuperado o local da sua primeira validação no dia [Remya e Mathew 2013, Hua-ling 2007]. Objetivando minimizar o problema de que um usuário pode permanecer durante boa parte da viagem na parte de trás do veículo, fazendo assim a validação do seu bilhete em um ponto distante da sua origem, foram analisados dados do seu Bilhete Único durante duas semanas (uma semana antes e uma semana depois), e foi assumindo como origem do mesmo o ponto de validação mais próximo do início da linha de ônibus que ele utilizou. De forma similar, um ponto de destino de um usuário pode ser assumido como o local da sua última validação no dia, sendo verificado se o local se repete no intervalo de duas semanas (também uma semana antes e uma semana depois) do dia onze [Gordillo 2006, Lam e Lo 1991].

Ao todo, foram estimadas origens e destinos de aproximadamente 40% dos usuários do sistema de ônibus de Fortaleza. É digno de destaque que essa amostra é significativamente maior que amostras extraídas por técnicas de survey, onde normalmente são entrevistados entre 0.5% e 1% dos usuários.

Foi ainda realizada uma validação espacial da amostra estimada. Espera-se que o método de estimativa garanta, com certo grau de confiabilidade, que a amostra não esteja polarizada espacialmente. No caso específico da técnica utilizada nesta tese, é desejável que os embarques nos ônibus, usados nas estimativas, sejam proporcionais (considerando cada parada de ônibus) ao número total de embarques. Mesmo tendo em vista que as heurísticas utilizadas garantiriam mais de 90% de acerto nas origens e destinos estimadas [Gordillo 2006, Lam e Lo 1991, Remya e Mathew 2013, Hua-ling 2007], não havia qualquer garantia de que a amostra extraída não fosse polarizada. Para validar espacialmente a amostra, verificou-se a correlação entre os embarques utilizados para estimar os pares origem-destino e o número total de embarques em pontos de ônibus em Fortaleza. A partir da equação:

(2)

onde representa o número total de embarques nos pontos de ônibus, representa o número de embarques utilizados nas estimativas e é uma constante de normalização, uma relação linear ou isométrica é evidenciada pelo valor o expoente , indicando que, proporcionalmente, os embarques utilizados nas estimativas são equivalentes ao número total de embarques em pontos de ônibus, constatando que as amostras foram extraídas de forma aleatória. Foi encontrado , a Figura 8 ilustra a regressão aplicada aos dados.

Figura 8: Validação estatística das origens e destinos estimadas. Cada círculo preto representa uma parada de ônibus. A linha vermelha representa a regressão linear aplicada aos dados, a linha contínua azul foi estimada pelo o método Nadaraya-Watson [Nadaraya 1964, Watson 1964] e as linhas tracejadas azuis delimitam o intervalo de confiança de 95% estimado por bootstrap [Racine e Li 2004, Li e Racine 2004]. Uma relação isométrica foi encontrada, com expoente e . O é o coeficiente de determinação da regressão [Rawlings, Pantula e Dickey 2001, Montgomery, Peck e Vining 2015].

11 Reconstrução das trajetórias dos usuários

As trajetórias dos usuários de ônibus são definidas pela composição das rotas dos ônibus que os levam entre seus pares origem-destino. O Algoritmo 1 mostra o pseudocódigo de estimativa da rota de um usuário. Em resumo, o algoritmo inicialmente busca um caminho direto entre o par origem-destino (do ponto até o ponto ), baseando-se na rota da linha de ônibus () que o usuário utilizou. Caso esse caminho direto exista, é definido como caminho do usuário o trecho da rota da linha de a . Caso não exista um caminho direto, busca-se um terminal que tenha alguma linha que o leve até seu destino estimado.

No contexto desta tese, um caminho não direto, ou indireto, pode ser definido como um caminho em que é necessário realizar um processo de baldeação, trocando de veículo antes para chegar a um destino. Em Furtado et al [Furtado et al. 2017] foi mostrado que a estrutura da rede de ônibus de Fortaleza permite que aproximadamente 40% dos seus usuários façam um caminho direto da sua origem até seu destino, considerando que o mesmo aceite se deslocar por até 500 metros a pé, tanto na origem quanto no destino.

1:
2:procedure ConstroiRotaUsuario(, , )
3:
4:     
5:
6:      = todos os caminhos diretos entre e por
7:
8:     if  está vazia  then
9:
10:         for each terminal que seja um ponto válido de baldeação entre e  do
11:
12:              
13:              
14:
15:              
16:
17:         end for
18:
19:     end if
20:
21:     if  está vazia  then
22:
23:          = menores caminhos diretos entre cada par de terminais
24:
25:         for each par de terminais em  do
26:
27:              
28:              
29:              
30:
31:              
32:
33:         end for
34:
35:     end if
36:
37:     retorne o caminho com menor distância em
38:
39:end procedure
40:
Algorithm 1 Algoritmo de reconstrução da rota de um usuário

12 Estimação de população flutuante a partir de trajetórias de usuários de ônibus

Após a estimativa dos caminhos dos usuários dentro da rede de ônibus, foram modeladas as suas trajetórias como um grafo direcionado , onde e são o conjunto de vértices, , e arestas, , respectivamente. Uma aresta, , entre dois vértices e é definida por um par ordenado . Na abordagem adotada aqui, os vértices representam paradas de ônibus e as arestas representam a demanda de usuários de ônibus entre duas paradas de ônibus consecutivas.

A título de exemplo, a Figura 9 ilustra uma representação hipotética de duas rotas de usuários. No exemplo ilustrado essas duas rotas são combinadas para formar uma pequena rede de fluxo. Em (a) é ilustrada a rota do primeiro usuário (), que visita em sequência as paradas de ônibus representadas pelos vértices , , e . Em (b), é ilustrada a rota de um segundo usuário (), que, dentro de um ônibus, visita em sequência as paradas de ônibus representadas pelos vértices , , , , e . Por fim, em (c), é ilustrada a rede resultante da combinação das duas rotas. É possível observar que a aresta conectada por e teve seu peso incrementado por ser um trecho em comum de passagem para e .

Figura 9: Composição das rotas dos usuários na construção de uma rede de fluxo. Em (a) é ilustrada uma rota hipotética do usuário . Em (b) é ilustrada a rota também hipotética de um usuário . Em (c) é ilustrado como é feita a composição das rotas para construir uma rede de fluxo.

Nesta tese, a rede de fluxo de pessoas foi construída a partir da combinação das rotas de ônibus reais de usuários que utilizaram o sistema de ônibus de Fortaleza no dia onze de março de 2015. A Figura 10, ilustra a distribuição espacial dos vértices (paradas de ônibus) dessa rede, cada círculo representa um vértice da mesma. Os vértices maiores e mais claros representam paradas de ônibus que têm maior fluxo de pessoas. Ao todo, essa rede possui 4783 vértices e 5789 arestas. Seu maior componente conexo possui 4768 vértices e essa rede só não é formada por um único componente conexo, porque existem linhas de ônibus que apenas trafegam pelo Campus do Pici (passando por 15 paradas de ônibus dentro do campus), da Universidade Federal do Ceará, e nenhuma outra linha de ônibus que circula fora do campus, entra no mesmo, impedindo a conexão dos dois componentes conexos.

Figura 10: Rede de fluxo estimada. É ilustrada a distribuição espacial dos vértices (que representam paradas de ônibus) dessa rede. Tamanho e cor dos nós são definidos pelo seu grau. Quanto maior e mais claro é o nó, mais conexões ele tem.

Na Figura 11 (a) é ilustrada a distribuição de graus dessa rede: observa-se que vértices com grau dois são os mais frequentes, são quase 3000 ao todo. Em (b) é ilustrada a distribuição de graus ponderados, sendo mais frequentes vértices com grau ponderado entre 0 e 10000, ao todo, são mais de 2500 vértices com essa característica.

Figura 11: Distribuições de graus da rede de fluxo estimada. (a) Distribuição de graus da rede. (b) Distribuição de graus ponderados: para melhor visualização essa distribuição foi gerada em 50 bins. Em (a) e (b) ainda é possível observar as suas respectivas distribuições em escala logarítmica embutidas nos gráficos.

Por fim, para estimar o volume de população flutuante presente em cada setor censitário, foi definida uma função, , para cada vértice , como a soma dos usuários que passam por . Desta forma, o volume de população flutuante, , de um setor censitário, , é definido a partir do somatório dos valores de para cada vértice, , dentro de . Dessa forma, é possível definir formalmente como:

(3)

onde é a quantidade de vértices (paradas de ônibus) presentes dentro do setor censitário .

13 Conjuntos de dados

Neste capítulo serão estudadas quatro variáveis, que tiveram seus valores extraídos de três conjuntos de dados. A partir do primeiro conjunto de dados são obtidos os valores da variável População Residente (PR). Esse conjunto de dados é fornecido pelo IBGE e quantifica o número de moradores por setor censitário na cidade de Fortaleza.

A partir de um conjunto de dados de mobilidade do sistema de ônibus, detalhado no capítulo desta tese, foi estimada a População Flutuante (PF). Para cada setor censitário foi mensurado o volume de população flutuante a partir da rede de fluxo de pessoas produzida através da análise de dados de mobilidade do sistema de ônibus de Fortaleza. PF foi mensurado pelo número de pessoas que trafegam por um setor censitário em um dia. A cidade de Fortaleza possui 2034 ônibus, que circulam por mais de 359 rotas distintas, atendendo aproximadamente 700 mil pessoas que usam diariamente o sistema de transporte público da cidade. Vale ressaltar que, no caso de Fortaleza, os ônibus ainda representam o principal meio de transporte da cidade.

Por fim, a partir do conjunto de dados de chamadas à polícia, disponibilizado pela Coordenadoria Integrada de Operações de Segurança (CIOPS), que possui 172332 chamadas para o serviço 190 sobre Crimes Contra o Patrimônio (CCP) e 97890 chamadas ao mesmo serviço sobre reclamação de Perturbação de Sossego Alheio (PSA)333disponível em http://wikicrimes.org/dados-oficiais/crimes.csv. Todas as chamadas à polícia foram feitas entre setembro de 2014 e março de 2016.

Aqui é assumido que mudanças maciças no ambiente urbano da cidade não podem ser produzidas no período de investigação (intervalo entre 4 e 6 anos). Mudanças relevantes nesse intervalo de tempo só existiriam se a sociedade estivesse enfrentando uma severa ruptura social, devido, por exemplo, a desastres naturais, graves crises econômicas ou guerras. O Apêndice II pode ser consultado para obter informações adicionais sobre todos os conjuntos de dados utilizados neste estudo, incluindo a URL para download.

14 Relação entre população e crime a partir de análises sobre setores censitários

Os mapas de calor nas Figuras 13(a)-13(d) fornecem a densidade local, em escala logarítmica, de PR, PF, PSA e CCP, respectivamente, em Fortaleza. Observa-se alguma correlação espacial tanto entre PR e PSA quanto em PF e CCP. Em especial, há uma evidente maior incidência de hot spots em (b) e (d) se comparado com (a) e (c). Além disso, no centro da cidade, destacado por círculos pretos em cada mapa, a alta densidade de PR é compatível com as altas taxas de CCP, enquanto baixas densidades de PR parecem explicar a baixa frequência de queixas PSA. Particularmente, o centro comercial de Fortaleza é uma região de característica populacional única, enquanto praticamente não há pessoas residindo no local, essa é a região da cidade com maior fluxo de pessoas. A aparente correlação espacial entre PR e PSA sugere que reclamação de perturbação de sossego é feita por residentes, possivelmente quando estão em casa, momento que é intuitivo pensar que um indivíduo deseja descansar e desta forma é mais sensível à perturbação. Vale ressaltar que os dados confirmam essa intuição: quase 80% das chamadas à polícia por PSA ocorrem entre oito horas da noite e uma hora da manhã, intervalo que a maior parte da população se encontra em casa, que representa pouco mais de 20% do tempo de um dia.

Figura 13: Mapas de densidade das variáveis estudadas em Fortaleza. (a) População residente (PR) por (). (b) População flutuante (PF) por . (c) Perturbação de sossego alheio (PSA) por . (d) Crimes contra o patrimônio (CCP) por . O círculo preto destaca o centro da cidade, essa região tem uma baixa densidade tanto de residentes quanto de reclamações de perturbação de sossego alheio, em contra partida é densa em fluxo de pessoas e crimes contra o patrimônio.

Apesar de parecer trivial sugerir que há alguma correlação entre PR e PSA, assim como entre PF e CCP a partir dos mapas de densidade ilustrados na 13, os respectivos gráficos de dispersão visíveis na Figura 14 falham em capturar a aparente correlação existente, devido à desagregação dos conjuntos dos dados de ambas populações. No presente momento, conjetura-se que tais correlações existam de fato, mas estão escondidas pelo nível de granularidade dos setores censitários. A maioria dos setores censitários tem uma área pequena, às vezes do tamanho de um quarteirão, e é provável que tal escala de granularidade seja insuficiente para capturar as correlações e, portanto, revelar o impacto da influência social sobre PSA e CCP. Adicionalmente, no caso de PR, a população tende a ser igualmente distribuída entre os setores censitários e isto impossibilita a percepção do fenômeno a nível de escala. De uma maneira geral, os setores censitários têm entre 600 e 800 residentes cada.

Figura 14: Gráficos de dispersão aplicados às variáveis estudadas. (a)-(d) Revelam a ausência de correlação nas variáveis estudadas a nível de setor censitário. Cada círculo preto representa um setor censitário e em todos os gráficos foi estimado coeficiente de determinação [Rawlings, Pantula e Dickey 2001, Montgomery, Peck e Vining 2015] .

15 Discussão

No presente capítulo buscou-se verificar se as leis de escala observadas por Bettencourt et al. [Bettencourt et al. 2007] e Melo et al. [Melo et al. 2014], em estudos intercidades, poderiam estar presentes dentro da cidade de Fortaleza. Apesar da aparente correlação visual nos mapas de densidade apresentados no painel da Figura 13, quando plotadas as informações em gráficos de dispersão (Figura 14) não foi possível verificar qualquer correlação estatística entre as variáveis estudadas.

Apesar dos gráficos de dispersão (Figura 14) apresentados neste capítulo sugerirem que não há qualquer correlação estatística entre população e crime em Fortaleza, é precipitado descartar a hipótese de que exista uma relação alométrica entre população e crime dentro da cidade. A literatura mostra que unidades administrativas de terreno são imprecisas para compreender fenômenos urbanos, essencialmente porque elas são definidas com restrições que buscam simplificar atividades de censo e controle cadastral, como normalizações por estatísticas de população residente [Oliveira, Andrade e Makse 2014, Arcaute et al. 2015, Cottineau et al. 2016].

Mesmo sabendo que setores censitários são definidos pela presença de população residente é difícil capturar uma correlação estatística utilizando uma unidade de terreno tão granular, mesmo para indicadores se são explicados pela presença desses residentes. Setores censitários têm área reduzida, às vezes do tamanho de uma quadra. Para uma possível correlação entre PR e PSA, pode-se imaginar um cenário, por exemplo, em que ocorre uma grande festa em uma quadra da cidade. Sabendo que grandes festas têm potencial de gerar reclamações de PSA muito além de uma quadra de distância, para compreender a relação entre a ocorrência dessa festa e suas reclamações de PSA, seria necessário agregar alguns setores censitários próximos. Vale salientar que mesmo que fossem utilizadas unidades administrativas de terreno menos granulares, como a divisão por bairros, ainda assim haveria a questão de que essas unidades também tem restrições de normalização por população residente na definição das suas fronteiras, dificultando assim a compreensão de fenômenos a nível de escala. Em Fortaleza, por exemplo, a maior parte dos bairros têm entre 30000 e 50000 residentes.

Por tudo que foi discutido neste capítulo, conjectura-se que a influência social que a população de uma cidade exerce sobre indicadores urbanos não pode ser explicada de maneira consistente utilizando divisões administrativas de terreno, sendo necessário estimar as fronteiras dessa influência social utilizando algorítimos de agrupamento isentos de qualquer tipo de restrição na definição dessas fronteiras. Baseando-se na conjectura recém apresentada, foi considerado fazer agrupamento das unidades territoriais de Fortaleza, utilizando a malha de setores censitários como base, devido ser a unidade com máxima resolução disponível, a fim de estimar as fronteiras de população flutuante e residente em Fortaleza.

16 Influência social mensurada a partir de agregados de população residente e flutuante

Para definir limites espaciais além de fronteiras administrativas, foi considerada a noção de continuidade espacial através da agregação de setores censitários que estão próximos uns dos outros fazendo uso do City Clustering Algorithm (CCA) [Makse et al. 1998, Rozenfeld et al. 2008, Giesen, Zimmermann e Suedekum 2010, Rozenfeld et al. 2011, Duranton e Puga 2013, Gallos et al. 2012, Duranton 2015, Eeckhout 2004]. O CCA encontra as fonteiras populacionais de uma área urbana considerando dois parâmetros, o primeiro, , um limiar de densidade populacional e o segundo, , um limiar de distância. Para um setor censitário , a densidade populacional é localizada em seu centro geométrico, se , então o setor censitário é considerado populado. O limiar de distância, , representa a distância de corte entre os setores censitários para considerá-los como espacialmente contíguos, mais precisamente, todos os setores censitários que estão em distâncias menores que são agrupados. Assim, um aglomerado encontrado pelo CCA é definido por áreas povoadas dentro de uma distância , como pode ser observado esquematicamente na Figura 15. Embora o algoritmo inicie de um setor censitário semente arbitrário, ele não produz aglomerados distintos ao variar esta semente. Os dois únicos fatores que são responsáveis pelo comportamento aglomerativo do CCA são os parâmetros e . Estudos recentes [Oliveira, Andrade e Makse 2014, Duranton e Puga 2013, Duranton 2015] demonstraram que os resultados produzidos pelo CCA são fracamente dependentes de e para uma faixa dos valores dos parâmetros. Neste trabalho, será quantificado em metros e em população residente ou flutuante por .

Figura 15: O comportamento aglomerativo do (CCA). Cada polígono representa uma unidade de agrupamento, especificamente no caso deste trabalho, setores censitários. Os polígonos na cor azul claro são candidatos a serem agrupados . Em contrapartida, os polígonos na cor cinza não podem ser agrupados (). (a) O ponto vermelho representa o centro geométrico do setor censitário e o círculo preto com raio procura vizinhos pertencentes ao mesmo aglomerado. (b)-(c) A mesma operação de busca é feita para os outros setores censitários até que não haja mais vizinhos dentro do raio de operação. (d) O algoritmo termina a execução e o aglomerado é encontrado.

Para determinar o efeito da parametrização sobre o valor do expoente , foi buscado um intervalo dentro dos parâmetros onde tem baixa sensibilidade a essa variação. A Figura 16 ilustra o comportamento do expoente em função da variação dos parâmetros CCA. Conforme é ilustrado nas Figuras 16 (a) e (b), o valor do expoente , estimado utilizando o método de regressão linear (mais detalhes no Anexo I), para PR contra PSA permanece praticamente insensível aos parâmetros CCA na faixa , independentemente dos valores de adotados no processo de estimativa. Além disso, a média fornece forte evidência de uma relação superlinear entre essas variáveis. Um comportamento semelhante pode ser observado entre PF e CCP, mas agora o expoente permanece praticamente invariável dentro do intervalo . O valor médio de , também nesse caso, indica a presença de uma relação alométrica superlinear. Nos itens (c) e (d) não se pode sugerir nenhum tipo de relação entre as variáveis, primeiro, devido a maior flutuação entre valores sublineares, isométricos e superlineares, segundo, devido ao maior valor médio do Erro Padrão do Coeficiente , representado pelas sombras no gráfico. Este resultado inclusive pode ser comparado com a variação do expoente alométrico para diferentes processos de aglomeração urbana [Oliveira, Andrade e Makse 2014, Arcaute et al. 2015, Cottineau et al. 2016].

Figura 16: Comportamento do expoente ao variar os parâmetros do CCA, e . Em (a) é ilustrada a variação de na correlação entre PR e PSA. Em (b) A variação é ilustrada para a correlação entre PF e CCP. Em (c) são ilustrados os valores de da relação entre PR e CCP. Por fim, em (d), são ilustrados os valores do expoente para a relação entre PF e PSA. Em todas as Figuras, (a-d), o eixo representa o valor de , que foi variado a partir de 100 até 800 metros (momento em que o maior aglomerado encontrado consome quase toda a cidade). O valor do expoente é exibido no eixo . As cores das linhas representam a variação do parâmetro , que correspondente à densidade de população residente nos itens (a) e (c), e a densidade de população flutuante nos itens (b) e (d). foi variado a partir de 1000 até 8000. As sombras representam o erro padrão do coeficiente . Os gráficos também mostram linhas tracejadas vermelhas, entre essas linhas é destacado o intervalo onde, independentemente da parametrização, o expoente tem intervalos menores de variação. As linhas pretas pontilhadas destacam o expoente , situação em que a relação entre variáveis é isométrica. Em (a), a relação é superlinear a partir de , já em (b), a superlinearidade aparece em . Em todas as figuras, as sombras coloridas representam o Erro Padrão do Coeficiente, a cor da sombra indica a que valor de o erro padrão está associado.

Neste ponto, é necessário determinar um critério para selecionar um valor adequado do parâmetro . São preferíveis pequenos valores de , pois estes conduzem a formação de muitos aglomerados no CCA, aumentando a quantidade de observações a serem incluídas na estatística. Também são desejáveis pequenos valores de , pois desta forma poucos setores censitários são eliminados do mapa, incluindo uma parcela maior da população na análise.

Adicionalmente, é proposto que a escolha de esteja associada a uma distribuição espacial mais homogênea da população [Oliveira, Andrade e Makse 2014]. Em outras palavras, deseja-se evitar que a divisão encontrada produza alguns aglomerados com uma concentração muito maior (ou muito menor) de pessoas que outros. A justificativa para evitar fazer análises mais profundas em divisões da cidade com essa característica é que não se sabe ao certo o efeito que a concentração de pessoas tem sobre o crime [Bettencourt et al. 2007, Oliveira, Andrade e Makse 2014, Melo et al. 2014]. Por exemplo, locais com densidade populacional extremamente alta podem, naturalmente, inibir que atividade criminosa ocorra, sendo esse possivelmente um fator que traz insegurança a agressores motivados. Em contrapartida, alguns locais com densidade populacional muito baixa podem fazer com que as rotinas de criminosos, vítimas e guardiões jamais entrem em convergência [Cohen e Felson 1979, Felson 2002]. Para isolar esse fator, será escolhida uma divisão de agregados que tenha a distribuição de densidade populacional mais próxima de uniforme possível.

Uma configuração de divisão por aglomerados da cidade, que tem distribuição de densidade populacional uniforme, pode ser obtida ao se buscar agrupamentos do CCA cujas áreas se aproximem de forma mais isométrica possível com os dados populacionais. Em outras palavras, é desejável escolher divisões que tenham a seguinte característica: Quando a população cresce, a área do aglomerado cresce proporcionalmente. Formalmente, uma relação isométrica entre população e área dos aglomerados do CCA, pode ser definida a partir da seguinte função:

(4)

com , onde é a população, é a área em dos aglomerados, e é uma constante.

Figura 17: Comportamento do expoente ao variar os parâmetros do CCA, e . (a) Variação de nas correlações entre população residente (PR) e área em quilômetros quadrados () dos aglomerados descobertos pelo CCA. (b) Variação dos expoentes das correlações entre a população flutuante (PF) e área. Em (a) e (b), O eixo representa o parâmetro , e o eixo representa o expoente . As cores das linhas representam a variação do parâmetro . foi variado a partir de 1000 até 8000. As linhas pretas pontilhadas destacam o expoente , situação em que a relação entre variáveis é isométrica.

Seguindo o procedimento previamente descrito, a partir da Figura 17a, obtém-se e correspondendo ao par de parâmetros do CCA que conduzem à relação isométrica mais próxima entre a área dos aglomerados e PR. No caso de PF e área dos aglomerados, foram escolhidos os valores e , a partir da Figura 17b. A Figura 18 ilustra as correlações encontradas entre as populações estudadas e a área dos seus aglomerados. Em (a) foi estimado o valor do expoente () para PR contra a área dos seus aglomerados. Já em (b) é ilustrada a correlação entre PF e a área dos seus aglomerados, cujo foi estimado expoente ().

Outra abordagem para definir poderia se basear na maximização . Infelizmente, no caso deste trabalho, não se mostra um bom indicador, pois ele se mantém praticamente constante ao variar e , como é possível visualizar na Figura 19. Outro problema de usar como indicador é que o aumento dos valores de e pode conduzir a um aumento artificial de , devido à acentuada diminuição do número de aglomerados, levando a uma configuração com apenas dois ou três pontos no gráfico de correlação. Neste trabalho, buscou-se usar o menor valor de possível para se ter uma grande representação da população da cidade.

Figura 18: Relação isométrica entre população residente (PR) e população flutuante (PF) com a área de seus aglomerados em quilômetros quadrados. (a) Correlação entre PR e área dos aglomerados encontrados pelo City Clustering Algorithm (CCA) para residentes por e metros. (b) Correlação entre PF e área para pessoas passando por e metros. A linha vermelha representa uma regressão Ordinary Least Square (OLS) aplicada ao logaritmo dos dados [Rawlings, Pantula e Dickey 2001, Montgomery, Peck e Vining 2015]. A linha contínua azul indica a regressão de kernel Nadaraya-Watson [Nadaraya 1964, Watson 1964]. Finalmente, as linhas tracejadas azuis delimitam 95% de intervalo de confiança estimado a partir de 500 amostras de aleatórias com substituição. é o Coeficiente de Determinação da regressão [Rawlings, Pantula e Dickey 2001, Montgomery, Peck e Vining 2015].
Figura 19: Comportamento do Coeficiente de Determinação ao variar os parâmetros do CCA, e . (a) A variação de na correlação entre população residente (PR) e perturbação de sossego alheio (PSA) é ilustrada. Em (b) é ilustrada a variação para correlações entre população flutuante (PF) e crimes contra o patrimônio (CCP). foi variado a partir de 1000 até 8000. As linhas pretas pontilhadas destacam o expoente , situação em que a relação entre variáveis é isométrica.

17 Resultados

Os setores censitários foram agrupados, usando o CCA, por PR e PF (Fig 20). Na Figura 20a, a divisão alcançada por PR é ilustrada, a cidade foi dividida usando metros e residentes por . Na Figura 20b é ilustrada a divisão encontrada para PF, usando metros e pessoas passando por em um dia. Ressalta-se a existência de maiores lacunas no mapa de PR (Fig 20a) do que ocorre no mapa de PF (Fig 20b). Tal característica se dá pelo fato de Fortaleza ter regiões de natureza apenas comercial, em outras palavras, regiões onde não existe uma grande presença de residentes. Quanto a população flutuante, há pessoas se movendo praticamente por toda a cidade, tanto em áreas comerciais, quanto em áreas residenciais.

Figura 20: CCA aplicado à população residente (PR) e população flutuante (PF) em Fortaleza. Cada cor representa um aglomerado, as áreas na cor cinza claro correspondem a setores censitários que não foram agrupados por terem . (a) densidade populacional foi utilizada para encontrar os limites dos aglomerados com metros e pessoas residindo por . (b) divisão encontrada considerando a mobilidade urbana é ilustrada, o mapa foi gerado para metros e pessoas passando por em um dia em Fortaleza.

Ao comparar com os resultados apresentados na Figura 14, a aplicação do CCA nos dados de população divulga um cenário diferente para as correlações entre as variáveis investigadas neste trabalho. Primeiro, como ilustrado na Figura 21a e 21b, relações superlineares em termos de leis de potência, , são reveladas entre PF e CCP, bem como entre PR e PSA, com expoentes e , respectivamente. Em contrapartida, as relações obtidas entre PF e PSA, bem como entre PR e CCP estão mais próximas de uma relação isométrica (linear), com expoentes e respectivamente, contudo, os valores baixos dos coeficientes de determinação correspondentes indicam que estes resultados devem ser interpretados com cautela.

Figura 21: Gráficos de dispersão calculados a partir dos aglomerados encontrados pelo CCA. As linhas vermelhas representam as regressões lineares aplicadas aos dados, as linhas contínuas azuis representam o método Nadaraya-Watson [Nadaraya 1964, Watson 1964] e as linhas tracejadas azuis delimitam o intervalo de confiança de 95% estimado por bootstrap [Racine e Li 2004, Li e Racine 2004]. (a) Uma relação superlinear foi encontrada, com expoente , entre população flutuante (PF) e crimes contra o patrimônio (CCP). (b) Uma relação superlinear também foi encontrada entre a população residente (PR) e perturbação de sossego alheio (PSA), com expoente . (c)-(d) Os gráficos de dispersão de PF com PSA e PR com CCP mostraram uma relação isométrica entre as variáveis, mas com correlações menores que (a) e (b). O é o Coeficiente de Determinação das regressões.

A relação alométrica superlinear entre PR e CCP, implica que o aumento do volume de popuação flutuante em uma região da cidade acontecerá a custo de uma taxa proporcionalmente maior de crimes na mesma região. Mais importante ainda, esse comportamento superlinear ocorrendo em microescala (dentro de uma cidade) fornece uma explicação plausível para a alometria de crimes sérios encontrados por Bettencourt et al. [Bettencourt et al. 2010] e Melo et al. [Melo et al. 2014] em estudos realizados com dados de cidades brasileiras e estadunidenses, em escala macrodinâmica. Diferente do que se afirmava, não é a população residente que explica o comportamento superlinear de crimes sérios, mas a movimentação das pessoas dentro dos aglomerados urbanos.

É digno de menção ainda que, o resultado da correlação entre PR e CCP, está de acordo com a Teoria das Atividades Rotineiras [Cohen e Felson 1979], que afirma que um crime ocorre pela convergência das rotinas de um agressor motivado, de uma vítima desprotegida, bem como a ausência de um guardião capaz de prevenir a transgressão. Além de fornecer apoio quantitativo para essa teoria, mostrando que a convergência das rotinas dos agentes aumenta o número de crimes, este estudo também indica o fato notável de que esse aumento é não-linear. Em outras palavras, este estudo provê a primeira explicação do fenômeno a nível de escala, mostrando que esse fenômeno não-linear ocorre em aglomerados onde passam dezenas de milhares, centenas de milhares e até milhões de pessoas em um dia.

18 Discussão

Os resultados obtidos ao fim deste capítulo respondem as questões de pesquisa expostas no capítulo desta tese.

- Há relações alométricas entre população e crime dentro de uma cidade?

Sim. Foram encontradas relações alométricas entre população e crime na cidade de Fortaleza. Utilizou-se o CCA para delimitar as fronteiras da influência social, mensurada indiretamente pela densidade de PR e PF em diversas regiões da cidade. Foi encontrado que PF escala de maneira alométrica com CCP, com expoente e PR escala com chamadas de PSA, também de forma superlinear, com expoente . Variando os parâmetros e do CCA, Fortaleza foi dividida de 3500 formas diferentes por estatísticas de população residente e mais 3500 por estatísticas de população flutuante (conforme ilustrado na Figura 16). Em mais de 80% dessas divisões, foram constadas relações alométricas superlineares de PR contra PSA e PF contra CCP, provendo forte evidência estatística de que existem tais relações.

- A quantidade de população residente e flutuante é igualmente importante para explicar a quantidade de crimes em diferentes regiões de uma cidade?

Não. Conforme já mencionado em , o aumento no número de chamadas de PSA é correlacionado com o crescimento de PR e o mesmo ocorre entre CCP e PF. No entanto as correlações substancialmente mais fracas encontradas entre PR contra CCP e PF contra PSA, sugerem que PR e PF não são adequadas para explicar a ocorrência de CCP e PSA, respectivamente. Esse resultado mostra que, diferente do se pensava, não é a grande concentração de população residente que explica o crescimento desproporcional de crimes violentos em muitas cidades, mas o processo diário de comutação das pessoas, que em microescala, propicia que haja convergência das rotinas de vítimas e criminosos, conforme é definido pela Teoria das Atividades Rotineiras [Cohen e Felson 1979].

Os resultados descritos aqui trazem alternativas para a implementação de práticas inovadoras para gestores públicos dentro de cidades. A mais óbvia delas se refere ao fato de que, ao mostrar a correlação de diferentes tipos de crimes não só com população residente, mas também com a população flutuante, estratégias de alocação da força policial devem ser implementadas através da análise de diferentes bases populacionais, dependendo do tipo de crime que se deseja prevenir. Por exemplo, a alocação de policiamento comunitário, mais apropriada para resolver conflitos que potencialmente podem emergir da perturbação de sossego, deve ser planejada a partir de uma configuração de aglomerados e uma análise de hot spots que foram produzidos da perspectiva da densidade da população residente. Quando é necessário estabelecer uma política de alocação de uma polícia uniformizada para mitigar os crimes contra o patrimônio, a alocação da força policial deve ser realizada a partir de uma análise do movimento das pessoas.

Além dessas estratégias de alocação policial, os resultados aqui descritos constituem importantes indicadores para a formulação de políticas públicas de uso do solo e de projeto ambiental em geral. Trabalhos nesta linha foram desenvolvidos em [Taylor e Harrell 1996], onde foi proposto um framework para associar espaços físicos e o sentimento de segurança, bem como [Brantingham e Brantingham 1981], que lançou a criminologia ambiental, focando seu estudo criminológico sobre fatores ambientais ou de contexto que podem influenciar a atividade criminosa. Esses fatores incluem espaço, tempo, lei, agressor e alvo ou vítima. Estes cinco componentes são uma condição necessária e suficiente, pois sem um, os outros quatro, mesmo juntos, não constituirão um incidente criminal. A descoberta que existe uma relação superlinear entre crime e população (residente ou flutuante) em aglomerados dentro das cidades, reforça a alegação de que as mudanças no espaço urbano podem levar à redução da criminalidade como discutido em [Kinney et al. 2008]. Neste contexto, acredita-se que existam duas estratégias possíveis para reduzir os crimes nas cidades. Em um curto período de tempo, pode-se tentar modificar a rota do transporte público, a fim de evitar uma alta convergência espaço-temporal das pessoas. Em um longo período de tempo, estimulando com isenções fiscais, por exemplo, poderiam ser criados diversos centros autônomos na cidade, isso certamente reduziria o deslocamento entre esses centros altamente convergentes.

19 Descrição do framework

19.1 Módulo de análise de dados

O módulo de análise de dados foi desenvolvido utilizando a plataforma de business intelligence Qlik Sense 444http://www.qlik.com/us/products/qlik-sense, que possibilita o tratamento e visualização de grandes volumes de dados. Foi desenvolvido um dashboard protótipo, que possui três painéis de visualização. O primeiro painel apoia a análise de dados brutos de crimes e população, o principal propósito desse painel é permitir que o usuário se familiarize com os dados, sendo possível verificar inconsistências ou buscar faixas dos dados que merecem passar por algum processo de higienização. O segundo painel dá suporte à análise de agregações de unidades terreno realizadas pelo CCA, onde é possível variar os parâmetros do algoritmo, avaliar a sensibilidade do expoente alométrico em função dessa variação e ainda analisar a relação entre a área dos aglomerados e sua população (tal qual foi apresentado na seção 16 desta tese). Por fim, o terceiro painel ilustra as correlações entre população e crime com seus respectivos expoentes alométricos encontrados. Foi incluído nesse módulo de análise de dados uma funcionalidade de exportação de delimitações definidas pela parametrização escolhida pelo usuário. As Figuras 22, 23 e 24 ilustram os painéis de visualização desenvolvidos. Todos os painéis são interativos, sendo possível realizar filtros por áreas de mapas e barras ou pontos de gráficos.

Figura 22: Painel de análise de de dados brutos. O mapa central ilustra a densidade de crimes ou população, dependendo da escolha do usuário. É possível observar ainda a distribuição de crimes por tipo, por bairro e por agência (e.g. PM, SAMU e DETRAN). Esse painel tem grande utilidade na verificação de inconsistências nos dados. A título de exemplo, foram observados erros de georreferenciamento nos dados de crime. Ao selecionar um bairro (no gráficos em tons de laranja à direita), observou-se que cerca de 5% das latitudes e longitudes apontavam para regiões fora do bairro. Devido a tal observação, esses dados foram removidos das análises.
Figura 23: Painel de análise de agregações de unidades terreno realizadas pelo o CCA. Esse painel permite avaliar o efeito da parametrização do CCA sobre o expoente alométrico nas relações entre população e crime. Os gráficos ilustrados são inspirados nas Figuras 16 e 17 desta tese.
Figura 24: Correlações entre população e crime com seus respectivos expoentes alométricos encontrados. A partir da seleção de um ponto (que representa uma configuração dos parâmetros do CCA) nos gráficos ilustrados no segundo painel de visualização, é possível verificar a dispersão dos dados de população e crime para a configuração do CCA escolhida. Esse terceiro painel também ilustra a divisão espacial dos aglomerados encontrados, tanto para população residente, quando para população flutuante.

19.2 Módulo de alocação

O módulo de alocação policial é um software, desenvolvido utilizando a linguagem de programação Java 555http://www.java.com, atualmente na versão 1.8. Esse módulo tem como entradas um arquivo KML, com uma divisão de uma cidade, a quantidade () de policiais disponíveis para alocação e informações georreferenciadas de crimes. O software distribui os recursos policiais por diferentes locais da cidade de forma proporcional à quantidade de crimes existentes no local. Desta forma, a parte de um recurso policial, , alocado em uma sub-região do espaço urbano (seja um aglomerado ou uma unidade administrativa de terreno), S, a partir da quantidade de crimes ocorridos em , , pode ser definido formalmente como:

(5)

onde corresponde ao total de policiais disponíveis para a alocação e ao total de crimes ocorridos em todo o espaço urbano disponível para alocação.

Foi ainda adotada uma política de alocação interna, mais precisamente a nível de . Tanto aglomerados de população, quanto unidades administrativas de terreno (e.g. divisão por bairros ou zonas) são compostos por setores censitários e internamente é também feito um direcionamento de recursos de forma proporcional a quantidade de crimes de cada setor dentro de . Em outras palavras, dentro de cada sub-região , setores com mais crimes recebem mais policiais. Essa política de sub-alocação é justificada pela necessidade de comparar as duas estratégias de alocação. A seguir isso será discutido de maneira mais profunda.

A arquitetura geral do framework desenvolvido pode ser visualizada na Figura 25.

Figura 25: Arquitetura geral do framework desenvolvido. O usuário utiliza o módulo de análise de dados para definir a melhor divisão da cidade para a alocação de uma polícia especializada para combater um determinado tipo de crime. O módulo de análise de dados gera como saída um arquivo KML com a divisão definida pelo usuário e essa divisão é utilizada no módulo de alocação policial. O usuário informa a quantidade de policiais disponíveis para a alocação. O módulo de análise de dados acessa informações de bancos de dados de crimes e população de uma cidade, já o módulo de alocação acessa apenas um banco de dados de crimes.

20 Estratégias

Serão comparadas aqui duas estratégias de alocação policial, as quais se inspiram no modelo de alocação mais popular, o modelo baseado em alta densidade de crimes [Sherman, Gartin e Buerger 1989, Sherman 1995, Weisburd e Braga 2006, Ratcliffe 2006, Wortley e Townsley 2016, Groff e Vigne 2002, Berk 2011, Kennedy, Caplan e Piza 2011], que aloca o recurso policial proporcionalmente em função da densidade de crimes nos locais.

A primeira estratégia, denominada Estratégia de Alocação por População Residente (APR), uma estratégia cujos recursos são distribuídos de forma proporcional à quantidade de ocorrências em divisões administrativas de terreno, normalmente definidas por estatísticas de população residente. Será adotada a divisão por bairros666disponível em http://dados.fortaleza.ce.gov.br/, pois apesar da divisão administrativa por setores censitários também estar disponível, a mesma é por demais segmentada, com alguns setores sendo menores que um quarteirão, sendo assim inviável de ser utilizada em uma política real de alocação.

A segunda estratégia de alocação utilizada, denominada Estratégia de Alocação por População Flutuante (APF), também distribuirá os recursos policiais de forma proporcional a quantidade de chamadas à polícia em uma divisão espacial, no entanto, nessa estratégia serão utilizados os aglomerados de fluxo de pessoas estimados na seção 16 desta tese, ilustrados na Figura 20b. Foi utilizado o módulo de análise de dados do framework desenvolvido para gerar um arquivo KML com a divisão de aglomerados por população flutuante ( e ).

21 Comparação das estratégias

Ao aplicar APR e APF em Fortaleza simulando a disponibilidade de um recurso policial total , obtém-se os mapas de calor ilustrados na Figura 26, itens (a) e (b) respectivamente. Observam-se hot spots mais intensos em APF, principalmente no centro comercial da cidade, destacado pelo circulo preto em ambas as figuras. Isso ocorre devido APF não alocar recursos policiais em áreas consideradas não populadas , concentrando mais policiais nas regiões mais críticas da cidade.

Figura 26: Alocação policial utilizando as duas estratégias estudadas. Em (a) é ilustrado mapa de densidade de policiais alocados utilizando APR, em (b) é ilustrado mapa de densidade de policiais alocados utilizando APF. Os círculos pretos destacam o centro comercial de Fortaleza, área de grande concentração de PF e por consequência, grande concentração de CCP.

Para efeito de comparação, foi calculada a quantidade de policiais alocados por bairro utilizando APF. Foi somada a quantidade de policiais nos setores censitários localizados dentro de cada bairro (A Tabela 2 ilustra a quantidade de policiais por bairro). Após isso, foi calculada a diferença percentual entre a quantidade de policiais alocados por bairro nas duas estratégias. Na Figura 27, itens (a) e (b), são ilustrados os bairros onde a alocação é mais semelhante e mais diferente respectivamente.

Id Bairro APR APF Id Bairro APR APF Id Bairro APR APF
35 67 93 36 5 14 54 137 99
33 13 18 34 61 71 50 131 103
39 50 28 37 39 52 52 43 111
38 165 167 43 231 242 53 100 98
42 68 69 41 89 94 46 225 215
40 10 0 22 16 18 51 37 63
23 562 571 24 17 27 44 144 115
25 131 163 26 5 3 47 181 120
27 66 131 28 61 60 48 19 14
29 71 58 3 385 349 45 97 75
2 64 61 1 20 28 61 167 139
0 44 62 30 40 43 49 19 17
7 29 33 6 87 115 63 46 59
32 96 96 5 119 120 60 53 61
31 18 20 4 95 74 65 48 49
9 50 62 8 106 128 62 82 111
19 24 30 17 60 60 55 69 82
18 37 48 15 199 159 64 32 23
16 125 118 13 130 137 57 170 118
14 36 53 11 55 64 56 25 36
12 85 65 21 99 70 59 143 88
20 83 87 109 42 34 58 59 61
108 40 63 107 109 147 75 69 59
106 103 63 105 141 175 76 57 36
104 88 76 103 5 5 73 148 144
99 121 72 102 7 0 74 29 39
101 110 102 100 85 101 71 39 43
98 92 103 97 31 22 72 63 30
96 56 77 95 35 38 68 202 205
94 61 62 93 78 165 70 153 137
92 4 4 91 39 28 66 42 54
90 122 111 10 271 278 69 199 232
88 125 67 89 58 57 85 10 3
79 176 88 114 69 96 67 26 32
78 49 42 115 138 167 87 42 22
77 123 91 112 100 133 84 43 58
113 95 117 110 173 190 81 30 14
111 31 26 82 54 59 86 24 6
83 15 24 80 138 181 - - -
Tabela 2: Quantidade de policiais alocados por bairro pelas duas estratégias de alocação policial estudadas.

De uma forma geral, observou-se menor diferença percentual nas alocações dos bairros com maior presença de PF. Esses bairros estão próximos ao centro comercial da cidade ou localizados em regiões com grande concentração de residentes (normalmente locais que são origem de fluxo de pessoas). Observou-se ainda que os bairros que apresentaram maior diferença percentual entre as quantidades de policiais alocados usando estratégias de alocação estudadas, são aqueles que possuem mais setores censitários não populados, ou seja, com densidade de PF abaixo do limiar estimado na seção 16 desta tese.

Figura 27: Diferenças e semelhanças entre as alocações estudadas. Em (a) são destacados na cor preta os bairros que tiveram alocação mais parecida utilizando APR e APF. Em (b) são destacados os bairros com maior diferença na quantidade de policiais alocados. Em ambas as figuras foram destacados 24 bairros, do total da cidade.

Na Figura 28 pode ser observada uma comparação mais precisa entre as duas estratégias de alocação. Em (a) são ilustradas as funções de interpolação [Boor et al. 1978] dos bairros pelo número de policiais alocados pelas duas estratégias estudadas. A interseção das áreas formadas pelas curvas da interpolação e o eixo revela aproximadamente 15% de dissimilaridade entre as alocações. Essa dissimilaridade pode ser observada de forma mais clara na Figura 28 (b), na qual são ilustradas as funções de interpolação dos histogramas gerados a partir da quantidade de policiais alocados por bairros segundo as duas estratégias. A linha azul representa a função de interpolação dos dados de APR, já a linha vermelha representa a função estimada para APF. A região na cor azul claro demarca a interseção entre as distribuições. As regiões na cor vermelho claro representam faixas dos dados onde não houve interseção. Essas regiões somadas representam 15% da área total.

Figura 28: Comparação entre APR e APF. Em (a) é ilustrada a quantidade de policiais alocados por bairro. A linha azul representa uma interpolação por splines cúbicos [Boor et al. 1978] (mais detalhes no Apêndice I) aplicada aos valores encontrados para APR. A linha vermelha representa a mesma interpolação aplicada para as quantidades de policiais alocados utilizando APF. Em (b) são ilustrados os histogramas das distribuições de alocação nos bairros da cidade. Para melhor visualização, os histogramas foram gerados em 20 bins [Wand 1997].

A diferença constatada entre as estratégias de alocação estudadas pode ser fruto da ineficiência de APR. Enquanto a alocação produzida por APF é fortemente correlacionada com o fluxo de pessoas, APR falha ao distribuir a mesma quantidade de recursos policiais seguindo as leis de escala encontradas na seção 17 desta tese. Na referida seção foi observada relação superlinear, com expoente , entre CCP e PF. A Figura 29 ilustra as correlações entre a quantidade de policiais alocados, pelas duas estratégias estudadas, e população flutuante nos aglomerados de fluxo de Fortaleza. Em (a) é ilustrada a correlação entre as alocações produzidas por APF e o fluxo de pessoas, observa-se uma evidente relação superlinear, com expoente e alto coeficiente de determinação [Rawlings, Pantula e Dickey 2001, Montgomery, Peck e Vining 2015] (), similar à encontrada na seção 17 desta tese. Em (b), apesar da aparente relação superlinear, o menor Coeficiente de Determinação () somado ao maior Erro Padrão do Coeficiente [Rawlings, Pantula e Dickey 2001, Montgomery, Peck e Vining 2015] () relevam uma possível imprecisão de APR em alocar recursos policiais de acordo com as necessidades de Fortaleza. Outro aspecto digno de menção, ainda na Figura 29, é a maior dispersão dos pontos em APR. Essa dispersão também pode revelar imprecisão dos métodos de alocação por divisões administrativas. Em (b), são destacados quatro aglomerados de PF, que mesmo possuindo considerável nível de fluxo de pessoas, poucos policiais são alocados para atender suas respectivas regiões. Isso ocorre porque as fronteiras dos bairros por vezes dividem os aglomerados de fluxo, que são naturalmente formados pela PF, dificultando uma alocação precisa naquela região.

Figura 29: Correlações entre policiais alocados e fluxo de pessoas em APR e APF. (a) e (b) ilustram respectivamente as correlações alcançadas para APF e APR. O eixo representa a PF e o eixo a quantidade de policiais alocados. As linhas vermelhas representam as regressões lineares aplicadas aos dados, as linhas contínuas azuis representam o método de Nadaraya-Watson [Nadaraya 1964, Watson 1964] e as linhas tracejadas azuis delimitam o intervalo de confiança 95% estimado por bootstrap [Racine e Li 2004, Li e Racine 2004]. Em (b) ainda são destacados quatro aglomerados (bolha vermelha) que têm proporcionalmente um fluxo grande de pessoas para uma pequena presença de policiais.

Existe uma evidente relação de causa e efeito entre PF e CCP. APR é capaz de produzir uma alocação policial superlinear em função do fluxo de pessoas, porém de forma imprecisa. Essa imprecisão se deve ao fato de que os métodos convencionais de alocação policial se baseiam apenas no efeito dessa relação entre quantidade de transeuntes e crimes. Quando APF considera os aglomerados de fluxo de pessoas como divisão territorial (causa) e a densidade de crimes para decidir a proporção de policiais adequada para cada aglomerado (efeito), é possível também alcançar a relação superlinear evidenciada anteriormente (na secão 17), no entanto, com maior precisão estatística, mensurada pelo coeficiente de determinação e erro padrão do coeficiente.

22 Discussão

Neste capítulo foi especificado um framework que apoia o maior entendimento a respeito da relação entre população e crime dentro de uma cidade. Esse framework ainda permite simular a alocação de recursos policiais por divisões administrativas de terreno e aglomerados de população. A motivação para a construção desse framework se deu pelos achados apresentados no capítulo desta tese, onde observou-se que população, residente ou flutuante, são correlacionadas com crimes, no entanto essa correlação é mais forte ou mais fraca dependendo do tipo de crime. O módulo de análise de dados desenvolvido permite manusear as informações e avaliar as correlações entre população e crime, para a partir daí, extrair a melhor divisão da cidade. Já o módulo de alocação usa uma divisão da cidade escolhida pelo usuário para simular a alocação de policiais por essa divisão, sendo essa alocação feita utilizando o modelo baseado em alta densidade de crimes.

O framework desenvolvido foi utilizado para gerar os aglomerados de população flutuante ilustrados na Figura 20b. Essa divisão da cidade foi utilizada em um estudo comparativo, que revelou que a alocação de recursos policiais em aglomerados de população flutuante conduz a uma distribuição de recursos significativamente diferente de estratégias de alocação baseadas em regiões administrativas, comumente definidas a partir da presença de residentes. Mais ainda, foi mostrado que a alocação tendo como base os aglomerados de população flutuante tende a ser mais adequada para combater o CCP, pois a distribuição de recursos policiais seguirá naturalmente uma lei de potência, o que é desejável, visto que se espera que o crime cresça desproporcionalmente em áreas com alta densidade de PF.

Os aspectos aqui discutidos abrem novas linhas de investigação. Em particular, é importante ressaltar que no capítulo desta tese também mostrou-se que, para PSA, a relação superlinear só é percebida tendo como base aglomerados definidos a partir de características da população residente. Isso indica que é necessário elaborar uma estratégia híbrida, em que diferentes políticas de alocação e diferentes divisões do espaço urbano precisam ser levadas em consideração para cada tipo de crime.

É digno de destaque ainda que existe a possibilidade de carregar no framework dados, de população e crimes, correspondentes a apenas uma parte do dia. É possível por exemplo carregar dados de PF e CCP apenas para um turno do dia, permitindo estudo de alocações diferentes por período de um dia. Mesmo no caso de PR, que não há informação nos conjuntos de dados do horário em que as pessoas estão de fato em suas residências, é possível fazer diferentes alocações no decorrer de um dia, pois é sabido que a maior parte das pessoas está em casa no turno da noite e madrugada.

23 Resultados alcançados e contribuições

Neste trabalho foi identificado que a relação entre população e crime é também alométrica dentro de uma cidade. Fazendo uso do City Clustering Algorithm (CCA) [Makse et al. 1998, Rozenfeld et al. 2008, Giesen, Zimmermann e Suedekum 2010, Rozenfeld et al. 2011, Duranton e Puga 2013, Gallos et al. 2012, Duranton 2015, Eeckhout 2004] para determinar aglomerados de população intracidade, foi mensurado volume de influência social com base na presença de população residente e flutuante nos setores censitários de Fortaleza, uma grande metrópole brasileira, localizada no estado do Ceará. Ao contrário de estudos intercidades, onde a influência social foi medida apenas pela presença de residentes, aqui se propõe que, dentro de uma cidade, a mobilidade humana seja considerada para entender a dinâmica de crimes contra o patrimônio. Foram alcançados resultados que mostram que a incidência desse tipo de crime cresce de forma superlinear, seguindo uma lei de potência em função da população flutuante, com expoente alométrico . Esse resultado sugere que o aumento do fluxo de pessoas em uma região da cidade leva a um número desproporcionalmente maior de crimes contra o patrimônio na mesma região.

A correlação observada entre população flutuante e crimes contra o patrimônio está de acordo com a Teoria das Atividades Rotineiras [Cohen e Felson 1979], que afirma que um crime ocorre pela convergência das rotinas de um agressor motivado, uma vítima desprotegida e a ausência de um guardião capaz de impedir o delito. Além de fornecer suporte quantitativo para essa teoria, o estudo apresentado nesta tese de doutorado indica o fato de que a convergência dessas rotinas produz um crescimento desproporcional da criminalidade. Esse resultado contrasta claramente com a incidência de chamadas relacionadas à perturbação de sossego alheio, onde uma relação alométrica também pode ser observada, mas em função de população residente, com expoente alométrico .

Sobre esses resultados, é ampla a discussão a respeito de leis de escala em indicadores urbanos e é sabido que relações superlineares entre população e esses indicadores não são de fato livres de escala [Bettencourt et al. 2007, Rozenfeld et al. 2008]. Apesar dos efeitos dessas relações crescerem seguindo uma lei de potência em função das suas causas, não é esperado que esse crescimento ocorra indefinidamente, tal qual é observado em estudos biológicos. No caso de uma relação alométrica entre população e homicídios [Melo et al. 2014], por exemplo, é intuitivo pensar que em algum momento essa relação assumirá comportamento isométrico ou sublinear, pois basicamente existem duas possibilidades: ou a população crescerá e os homicídios diminuirão, atenuando o comportamento superlinear, ou ocorrerão tantos homicídios que será impossível que a população cresça, inviabilizando a percepção da relação superlinear para ordens de grandeza superiores. Um fato que pode indicar que uma relação superlinear está a caminho de sofrer uma transição para uma relação isométrica é a presença de observações do fenômeno abaixo da reta de regressão, principalmente nas suas maiores ordens de grandeza. Mesmo diante da sua natureza microdinâmica, natureza ideal para compreensão mais precisa da dinâmica desses indicadores no espaço urbano, neste estudo, não foi percebido qualquer indício de que essas relações superlineares entre população e crimes estejam próximas de um ponto de atenuação.

A compreensão da dinâmica do crime dentro de uma grande metrópole pode ajudar em eventuais políticas de mitigação da violência, essencialmente na tarefa de alocação de recursos policiais. A partir dos achados desta pesquisa, foi conduzido um exercício de aplicação da descoberta de que leis de escala governam a relação entre população e crime. Foi simulada e comparada a alocação de policiais em Fortaleza por unidades administrativas de terreno e aglomerados de população flutuante. Os resultados alcançados revelam que a alocação por unidades administrativas de terreno falha em distribuir recursos policiais seguindo as leis de escala observadas anteriormente, transparecendo uma provável imprecisão de métodos de alocação policial convencionais para prevenir crimes contra o patrimônio, por exemplo. Neste trabalho se conjectura de que a suposta imprecisão das estratégias de alocação policial convencionais advêm do fato de que as autoridades policias distribuem recursos no espaço urbano considerando apenas o efeito da relação entre população flutuante e crimes contra o patrimônio, a densidade de crimes.

24 Limitações da pesquisa

Neste trabalho buscou-se compreender um fenômeno, mais precisamente buscou-se compreender a dinâmica do crime dentro de uma cidade. Embora Fortaleza tenha sido dividida de inúmeras formas e mais de 80% dessas divisões tenham apresentado uma relação alométrica entre população e crime, a generalização desse achado é condicionada a verificação do fenômeno em outras cidades. Durante a execução desta tese buscou-se bases de dados de mobilidade humana para outras grandes metrópoles, no entanto, foi constatada uma grande dificuldade de se obter acesso a conjuntos de dados desse tipo, essencialmente por questões de privacidade. Uma alternativa comercial para vencer essa dificuldade é comprar dados da plataforma LandScan, que faz uso de um sistema de informação geográfica e sensoriamento remoto para estimar a população flutuante em todo o globo terrestre, com aproximadamente 1 km de resolução. O LandScan pode ser definido ainda como uma plataforma de alta resolução de dados de população ambiente [Andresen 2011, Malleson e Andresen 2015], onde é definida a quantidade de população flutuante em cada local por uma média de cada 24 horas. Recentemente foi adquirido recurso para a compra dos dados de população ambiente da plataforma para várias cidades americanas, no entanto, por questões burocráticas, não foi obtido acesso a esses dados antes da conclusão desta tese.

Outra limitação desta pesquisa está relacionada à validação da estratégia de Alocação por População Flutuante (APF), proposta no capítulo desta tese. Apesar de ter sido mostrado que a APF tende a ser mais adequada para combater o crimes contra o patrimônio, essencialmente porque a distribuição de recursos policiais seguirá naturalmente uma lei de potência, não foi verificado se APF é de fato mais efetiva na prevenção de crimes que estratégias de alocação policial convencionais. Para realizar uma validação mais profunda seria necessário um teste em campo ou a aplicação dessa estratégia em modelos de simulação [Melo, Belchior e Furtado 2005]. Infelizmente, ambas as soluções se mostraram inviáveis nesta pesquisa.

25 Trabalhos futuros

Os trabalhos futuros identificados nesta tese de doutorado podem ser divididos em dois grupos:

  1. [label=()]

  2. Aplicações para a descoberta de que relações alométricas entre população e crime ocorrem também dentro de cidades.

  3. Aplicações para a rede de fluxo de pessoas reconstruída nesta tese a partir de dados de mobilidade do sistema de ônibus de Fortaleza.

A respeito de trabalhos futuros para a aplicação desse novo conhecimento de que existe uma relação superlinear entre população e chamadas à polícia dentro de cidades, pode ser destacado a definição de políticas públicas para propor estratégias de reorganização do espaço urbano. Sabendo que, a quantidade de crimes contra o patrimônio, por exemplo, cresce seguindo uma lei de potência em função da quantidade de transeuntes e assumindo que uma redistribuição populacional não altera o comportamento superlinear observado, deve ser evitado que existam lugares que concentrem muitas pessoas. A concentração de muitas pessoas em poucos lugares produz mais crimes, desta forma, uma redistribuição populacional que proporcione que parcelas iguais de população flutuante estejam distribuídas pelo espaço urbano diminuirá a violência em termos quantitativos. Uma redistribuição do fluxo de pessoas no espaço urbano de uma grande metrópole pode ser alcançada em médio prazo, a partir de políticas públicas de incentivo ao uso de certas áreas da cidade, ou em longo prazo, a partir da criação de zonas autônomas (áreas que atendam por completo pessoas da região, com emprego, moradia, escolas e lazer, reduzindo o processo de comutação entre as zonas da cidade) com distribuição populacional uniforme. Essa política pública é de grande complexidade de execução, especialmente porque pessoas que vivem em grandes cidades possuem hábitos de mobilidade que dificultam o processo. A título de exemplo, recentemente foi mostrado que mais de 30% da população da cidade passa pelo centro econômico de Fortaleza em um dia de semana [Caminha et al. 2016, Caminha et al. 2016].

Em relação a aplicações para a rede de fluxo de pessoas reconstruída neste trabalho, atualmente está sendo desenvolvido um simulador de sistemas de transporte público, projetado a partir de dados reais de mobilidade dos cidadãos de Fortaleza. Foi estimada a probabilidade de um passageiro surgir em uma parada de ônibus, escolher uma determinada linha de ônibus e escolher um ponto de baldeação. Essas probabilidades foram estimadas através da demanda real da rede de ônibus, representada pela rede de fluxo reconstruída nesta tese. Se espera que, em breve, seja possível simular o efeito que mudanças no espaço urbano ou na estrutura da rede de transporte público têm em indicadores sociais e vice-versa. Trabalhos em andamento, utilizando esse simulador, mostram que os cidadãos de Fortaleza escolhem rotas ruins [Furtado et al. 2017] e há indícios de que muitas pessoas escolhem rotas mais lentas para evitar áreas perigosas [Sullivan et al. 2017]. Em curto prazo, se espera que seja possível testar a criação/alteração de rotas de linhas de ônibus antes das mesmas serem implementadas. A longo prazo é esperado que seja possível estudar o comportamento do crime após uma reorganização do espaço urbano, como a criação das zonas autônomas já mencionadas nesta seção.

Motivado pelos inúmeros trabalhos que buscam compreender a propagação de doenças em uma macroescala global [Colizza et al. 2007, Hufnagel, Brockmann e Geisel 2004, Wang et al. 2009], pelas recorrentes epidemias de dengue no Brasil e pela carência de estudos que utilizam dados de mobilidade humana para compreender a dinâmica da propagação de epidemias em microescala (escala de cidade), é identificado como trabalho futuro relacionado a esta tese de doutorado a compreensão do espalhamento do vírus da dengue em Fortaleza. Deseja-se utilizar a rede de mobilidade humana reconstruída para descobrir focos do mosquito aedes aegypti, único vetor reconhecido como transmissor do vírus. A partir de uma base de dados, recém adquirida, de atendimentos de casos da doença ocorridos entre 2008 e 2016, busca-se estudar as rotinas de movimentação das pessoas infectadas a fim de encontrar focos desconhecidos de proliferação do mosquito. Um dos grandes desafios dessa pesquisa está relacionado ao fato de que não há qualquer informação a respeito da distribuição espacial dos mosquitos. Deste modo, deseja-se utilizar modelos estatísticos e de simulação, aliados à utilização de dados reais de mobilidade e casos da doença, para compreender a propagação da doença em uma grande metrópole.

Artigos publicados em periódicos

CAMINHA, C. et al. Human mobility in large cities as a proxy for crime. PLoS ONE, v. 2, n. 12, p. e0171609, 2017.

CAMINHA, C.; FURTADO, V. Modeling user reports in crowdmaps as a complex network. In: Journal of Information and Data Management 3 (3), 179, 2013.

FURTADO, V. et al. Open government and citizen participation in law enforcement via crowd mapping. IEEE Intelligent Systems, IEEE, v. 27, n. 4, p. 63–69, 2012.

Artigos publicados em anais de congresso

CAMINHA, C. et al. Detecção de comunidades em redes complexas para identificar gargalos e desperdício de recursos em sistemas de ônibus. In: IV Brazilian Workshop on Social Network Analysis and Mining, 2017. p. 1-7.

CAMINHA, C. et al. Micro-interventions in urban transportation from pattern discovery on the flow of passengers and on the bus network. In: IEEE. Smart Cities Conference (ISC2), 2016 IEEE International. [S.l.], 2016. p. 1–6.

PONTE, C.; CAMINHA, C.; FURTADO, V. Busca de melhor caminho entre dois pontos quando múltiplas origens e múltiplos destinos são possíveis. In: ENIAC. [S.l.: s.n.], 2016.

CAMINHA, C.; FURTADO, V. Impact of Human Mobility on Police Allocation. In: Conference of Intelligence and Security Informatics (ISI), 2017.

SULLIVAN, D.; et al.Towards Understanding the Impact of Crime in a Choice of a Route by a Bus Passenger. In: Agent-Based Modelling for Criminological Research, 2017.

Artigos sob avaliação

FURTADO, V. et al. Increasing the Likelihood of Finding Public Transport Riders that Face Problems Through a Data-Driven approach. In. Journal of Transportation Research, 2017.

Referências

  • [Agnew 2007] AGNEW, R. Pressured into crime: An overview of general strain theory. 2007.
  • [Albert e Barabási 2002] ALBERT, R.; BARABÁSI, A.-L. Statistical mechanics of complex networks. Reviews of modern physics, APS, v. 74, n. 1, p. 47, 2002.
  • [Albert, Jeong e Barabási 2000] ALBERT, R.; JEONG, H.; BARABÁSI, A.-L. Error and attack tolerance of complex networks. nature, Nature Publishing Group, v. 406, n. 6794, p. 378–382, 2000.
  • [Alves et al. 2015] ALVES, L. et al. Spatial correlations, clustering and percolation-like transitions in homicide crimes. EPL (Europhysics Letters), IOP Publishing, v. 111, n. 1, p. 18002, 2015.
  • [Alves et al. 2015] ALVES, L. G. et al. Scale-adjusted metrics for predicting the evolution of urban indicators and quantifying the performance of cities. PloS One, Public Library of Science, v. 10, n. 9, p. e0134862, 2015.
  • [Alves et al. 2013] ALVES, L. G. et al. Distance to the scaling law: a useful approach for unveiling relationships between crime and urban metrics. PLoS One, Public Library of Science, v. 8, n. 8, p. e69580, 2013.
  • [Alves, Ribeiro e Mendes 2013] ALVES, L. G.; RIBEIRO, H. V.; MENDES, R. S. Scaling laws in the dynamics of crime growth rate. Physica A: Statistical Mechanics and its Applications, Elsevier, v. 392, n. 11, p. 2672–2679, 2013.
  • [Anderson e Wincoop 2003] ANDERSON, J. E.; WINCOOP, E. V. Gravity with gravitas: a solution to the border puzzle. the american economic review, American Economic Association, v. 93, n. 1, p. 170–192, 2003.
  • [Andresen 2011] ANDRESEN, M. A. The ambient population and crime analysis. The Professional Geographer, Taylor & Francis, v. 63, n. 2, p. 193–212, 2011.
  • [Anselin et al. 2000] ANSELIN, L. et al. Spatial analyses of crime. Criminal justice, v. 4, n. 2, p. 213–262, 2000.
  • [Anselin, Varga e Acs 2000] ANSELIN, L.; VARGA, A.; ACS, Z. J. Geographic and sectoral characteristics of academic knowledge externalities. Papers in regional science, Springer, v. 79, n. 4, p. 435–443, 2000.
  • [Arbesman, Kleinberg e Strogatz 2009] ARBESMAN, S.; KLEINBERG, J. M.; STROGATZ, S. H. Superlinear scaling for innovation in cities. Physical Review E, APS, v. 79, n. 1, p. 016115, 2009.
  • [Arcaute et al. 2015] ARCAUTE, E. et al. Constructing cities, deconstructing scaling laws. Journal of The Royal Society Interface, The Royal Society, v. 12, n. 102, p. 20140745, 2015.
  • [Arcaute et al. 2016] ARCAUTE, E. et al. Cities and regions in britain through hierarchical percolation. Open Science, The Royal Society, v. 3, n. 4, p. 150691, 2016.
  • [Beato e Silveira 2014] BEATO, C.; SILVEIRA, A. Effectiveness and evaluation of crime prevention programs in minas gerais. Stability: International Journal of Security and Development, v. 3, n. 1, 2014.
  • [Bento, Franco e Kaffine 2006] BENTO, A. M.; FRANCO, S. F.; KAFFINE, D. The efficiency and distributional impacts of alternative anti-sprawl policies. Journal of Urban Economics, Elsevier, v. 59, n. 1, p. 121–141, 2006.
  • [Berk 2011]

    BERK, R. Asymmetric loss functions for forecasting in criminal justice settings.

    Journal of Quantitative Criminology, Springer, v. 27, n. 1, p. 107–123, 2011.
  • [Bettencourt 2013] BETTENCOURT, L. M. The origins of scaling in cities. science, American Association for the Advancement of Science, v. 340, n. 6139, p. 1438–1441, 2013.
  • [Bettencourt et al. 2007] BETTENCOURT, L. M. et al. Growth, innovation, scaling, and the pace of life in cities. Proceedings of the national academy of sciences, National Acad Sciences, v. 104, n. 17, p. 7301–7306, 2007.
  • [Bettencourt et al. 2010] BETTENCOURT, L. M. et al. Urban scaling and its deviations: Revealing the structure of wealth, innovation and crime across cities. PloS One, Public Library of Science, v. 5, n. 11, p. e13541, 2010.
  • [Boor et al. 1978] BOOR, C. D. et al. A practical guide to splines. [S.l.]: Springer-Verlag New York, 1978. v. 27.
  • [Brantingham e Brantingham 1981] BRANTINGHAM, P. J.; BRANTINGHAM, P. L. Environmental criminology. [S.l.]: Sage Publications Beverly Hills, CA, 1981.
  • [Brantingham e Brantingham 1984] BRANTINGHAM, P. J.; BRANTINGHAM, P. L. Patterns in crime. [S.l.]: Macmillan New York, 1984.
  • [Brockmann, Hufnagel e Geisel 2006] BROCKMANN, D.; HUFNAGEL, L.; GEISEL, T. The scaling laws of human travel. Nature, Nature Publishing Group, v. 439, n. 7075, p. 462–465, 2006.
  • [Brown 2000] BROWN, J. H. Scaling in biology. [S.l.]: Oxford University Press on Demand, 2000.
  • [Brownstone e Golob 2009] BROWNSTONE, D.; GOLOB, T. F. The impact of residential density on vehicle usage and energy consumption. Journal of Urban Economics, Elsevier, v. 65, n. 1, p. 91–98, 2009.
  • [Bullock 1955] BULLOCK, H. A. Urban homicide in theory and fact. The Journal of Criminal Law, Criminology, and Police Science, JSTOR, v. 45, n. 5, p. 565–575, 1955.
  • [Caminha e Furtado 2012] CAMINHA, C.; FURTADO, V. Modeling user reports in crowdmaps as a complex network. In: CITESEER. Proceedings of 21st International World Wide Web Conference. [S.l.], 2012.
  • [Caminha et al. 2016] CAMINHA, C. et al. Micro-interventions in urban transportation from pattern discovery on the flow of passengers and on the bus network. In: IEEE. Smart Cities Conference (ISC2), 2016 IEEE International. [S.l.], 2016. p. 1–6.
  • [Caminha et al. 2016] CAMINHA, C. et al. Mining the networks of supply and demand of public transport for overload and waste of resources. CoRR, abs/1606.03737, 2016. Disponível em: http://arxiv.org/abs/1606.03737.
  • [Caywood 1998] CAYWOOD, T. Routine activities and urban homicides: a tale of two cities. Homicide Studies, SAGE Periodicals Press, v. 2, n. 1, p. 64–82, 1998.
  • [Centro] CENTRO, D. espacial da criminalidade no. Distribuição espacial da criminalidade no centro histórico da cidade de belém (pará/brasil).
  • [Clarke e Felson 1993] CLARKE, R.; FELSON, M. Routine Activity and Rational Choice. [S.l.]: Transaction Publishers, 1993. (Advances in Criminological Theory). ISBN 9781560000877.
  • [Cohen e Felson 1979] COHEN, L.; FELSON, M. Social change and crime rate trends: A routine activity approach. American Sociological Review, [American Sociological Association, Sage Publications, Inc.], v. 44, n. 4, p. 588–608, 1979. ISSN 00031224. Disponível em: http://www.jstor.org/stable/2094589.
  • [Colizza et al. 2007] COLIZZA, V. et al. Modeling the worldwide spread of pandemic influenza: baseline case and containment interventions. PLoS Med, Public Library of Science, v. 4, n. 1, p. e13, 2007.
  • [Cottineau et al. 2016] COTTINEAU, C. et al. Defining urban agglomerations to detect agglomeration economies. arXiv preprint arXiv:1601.05664, 2016.
  • [Daigle, Fisher e Cullen 2008] DAIGLE, L. E.; FISHER, B. S.; CULLEN, F. T. The violent and sexual victimization of college women is repeat victimization a problem? Journal of interpersonal violence, Sage Publications, v. 23, n. 9, p. 1296–1313, 2008.
  • [Dodman 2009] DODMAN, D. Blaming cities for climate change? an analysis of urban greenhouse gas emissions inventories. Environment and Urbanization, SAGE Publications, v. 21, n. 1, p. 185–201, 2009.
  • [D’Orsogna e Perc 2015] D’ORSOGNA, M. R.; PERC, M. Statistical physics of crime: A review. Physics of life reviews, Elsevier, v. 12, p. 1–21, 2015.
  • [Duranton 2015] DURANTON, G. Delineating metropolitan areas: Measuring spatial labour market networks through commuting patterns. In: The Economics of Interfirm Networks. [S.l.]: Springer, 2015. p. 107–133.
  • [Duranton e Puga 2013] DURANTON, G.; PUGA, D. The growth of cities. CEPR Discussion Paper No. DP9590, 2013.
  • [Eagle, Pentland e Lazer 2006] EAGLE, N.; PENTLAND, A.; LAZER, D. Inferring social network structure using mobile phone data. Proc. of National Academy of Sciences, 2006.
  • [Eagle, Pentland e Lazer 2009] EAGLE, N.; PENTLAND, A. S.; LAZER, D. Inferring friendship network structure by using mobile phone data. Proceedings of the national academy of sciences, National Acad Sciences, v. 106, n. 36, p. 15274–15278, 2009.
  • [Eeckhout 2004] EECKHOUT, J. Gibrat’s law for (all) cities. The American Economic Review, American Economic Association, v. 94, n. 5, p. 1429–1451, 2004.
  • [Felson 2002] FELSON, M. Crime and Everyday Life. [S.l.]: SAGE Publications, 2002. ISBN 9780761987611.
  • [Ferrett 2007] FERRETT, G. Biofuels ‘crime against humanity’. BBC News, v. 27, 2007.
  • [Filho et al. 2001] FILHO, C. C. B. et al. Conglomerados de homicídios e o tráfico de drogas em belo horizonte, minas gerais, brasil, de 1995 a 1999 homicide clusters and drug traffic in belo horizonte, minas gerais state, brazil. Cad. Saúde Pública, SciELO Brasil, v. 17, n. 5, p. 1163–1171, 2001.
  • [Fluschnik et al. 2014] FLUSCHNIK, T. et al. The size distribution, scaling properties and spatial organization of urban clusters: a global and regional perspective. arXiv preprint arXiv:1404.0353, 2014.
  • [Furtado et al. 2012] FURTADO, V. et al. Open government and citizen participation in law enforcement via crowd mapping. IEEE Intelligent Systems, IEEE, v. 27, n. 4, p. 63–69, 2012.
  • [Furtado et al. 2017] FURTADO, V. et al. Increasing the likelihood of finding public transport riders that face problems through a data-driven approach. arXiv, arXiv:1705.03504, 2017. Disponível em: https://arxiv.org/abs/1705.03504.
  • [Gallos et al. 2012] GALLOS, L. K. et al. Collective behavior in the spatial spreading of obesity. Scientific reports, Nature Publishing Group, v. 2, 2012.
  • [Gelman, Fagan e Kiss 2007] GELMAN, A.; FAGAN, J.; KISS, A. An analysis of the new york city police department’s “stop-and-frisk” policy in the context of claims of racial bias. Journal of the American Statistical Association, Taylor & Francis, v. 102, n. 479, p. 813–823, 2007.
  • [Giesen, Zimmermann e Suedekum 2010] GIESEN, K.; ZIMMERMANN, A.; SUEDEKUM, J. The size distribution across all cities–double pareto lognormal strikes. Journal of Urban Economics, Elsevier, v. 68, n. 2, p. 129–137, 2010.
  • [Glaeser e Kahn 2010] GLAESER, E. L.; KAHN, M. E. The greenness of cities: carbon dioxide emissions and urban development. Journal of urban economics, Elsevier, v. 67, n. 3, p. 404–418, 2010.
  • [Gomez-Lievano, Youn e Bettencourt 2012] GOMEZ-LIEVANO, A.; YOUN, H.; BETTENCOURT, L. M. The statistics of urban scaling and their connection to zipf’s law. PLoS One, Public Library of Science, v. 7, n. 7, p. e40393, 2012.
  • [Gonzalez, Hidalgo e Barabasi 2008] GONZALEZ, M. C.; HIDALGO, C. A.; BARABASI, A.-L. Understanding individual human mobility patterns. Nature, Nature Publishing Group, v. 453, n. 7196, p. 779–782, 2008.
  • [González, Lind e Herrmann 2006] GONZÁLEZ, M. C.; LIND, P. G.; HERRMANN, H. J. System of mobile agents to model social networks. Physical review letters, APS, v. 96, n. 8, p. 088702, 2006.
  • [Gordillo 2006] GORDILLO, F.

    The value of automated fare collection data for transit planning: an example of rail transit od matrix estimation

    . Tese (Doutorado) — Massachusetts Institute of Technology, 2006.
  • [Groff e McEwen 2012] GROFF, E.; MCEWEN, T. Exploring the Spatial Configuration of Places Related to Homicide Events,. [S.l.]: BiblioGov, 2012.
  • [Groff e Vigne 2002] GROFF, E. R.; VIGNE, N. G. L. Forecasting the future of predictive crime mapping. Crime Prevention Studies, Criminal Justice Press, v. 13, p. 29–58, 2002.
  • [Guedes, Furtado e Pequeno 2014] GUEDES, R.; FURTADO, V.; PEQUENO, T. Multiagent models for police resource allocation and dispatch. In: IEEE. Intelligence and Security Informatics Conference (JISIC), 2014 IEEE Joint. [S.l.], 2014. p. 288–291.
  • [Hanley, Lewis e Ribeiro 2016] HANLEY, Q. S.; LEWIS, D.; RIBEIRO, H. V. Rural to urban population density scaling of crime and property transactions in english and welsh parliamentary constituencies. PloS One, Public Library of Science, v. 11, n. 2, p. e0149546, 2016.
  • [Hidalgo e Rodriguez-Sickert 2008] HIDALGO, C. A.; RODRIGUEZ-SICKERT, C. The dynamics of a mobile phone network. Physica A: Statistical Mechanics and its Applications, Elsevier, v. 387, n. 12, p. 3017–3024, 2008.
  • [Holland e Leinhardt 1971] HOLLAND, P. W.; LEINHARDT, S. Transitivity in structural models of small groups. Comparative Group Studies, Sage Publications Sage CA: Thousand Oaks, CA, v. 2, n. 2, p. 107–124, 1971.
  • [Hsu, Gupta e Sorooshian 1995]

    HSU, K.-l.; GUPTA, H. V.; SOROOSHIAN, S. Artificial neural network modeling of the rainfall-runoff process.

    Water resources research, Wiley Online Library, v. 31, n. 10, p. 2517–2530, 1995.
  • [Hu e Lo 2007]

    HU, Z.; LO, C. Modeling urban growth in atlanta using logistic regression.

    Computers, Environment and Urban Systems, Elsevier, v. 31, n. 6, p. 667–688, 2007.
  • [Hua-ling 2007] HUA-LING, R. Origin-destination demands estimation in congested dynamic transit networks. In: IEEE. Management Science and Engineering, 2007. ICMSE 2007. International Conference on. [S.l.], 2007. p. 2247–2252.
  • [Hufnagel, Brockmann e Geisel 2004] HUFNAGEL, L.; BROCKMANN, D.; GEISEL, T. Forecast and control of epidemics in a globalized world. Proceedings of the National Academy of Sciences of the United States of America, National Acad Sciences, v. 101, n. 42, p. 15124–15129, 2004.
  • [Ignazzi 2014] IGNAZZI, C. A. Scaling laws, economic growth, education and crime: evidence from brazil. L’Espace géographique, Belin, v. 43, n. 4, p. 324–337, 2014.
  • [Kahn 2007] KAHN, M. E. Green cities: urban growth and the environment. [S.l.]: Brookings Institution Press, 2007.
  • [Kelling e Coles 1997] KELLING, G. L.; COLES, C. M. Fixing broken windows: Restoring order and reducing crime in our communities. [S.l.]: Simon and Schuster, 1997.
  • [Kennedy, Caplan e Piza 2011] KENNEDY, L. W.; CAPLAN, J. M.; PIZA, E. Risk clusters, hotspots, and spatial intelligence: risk terrain modeling as an algorithm for police resource allocation strategies. Journal of Quantitative Criminology, Springer, v. 27, n. 3, p. 339–362, 2011.
  • [Kennedy e Forde 1990] KENNEDY, L. W.; FORDE, D. R. Routine activities and crime: An analysis of victimization in canada. Criminology, Wiley Online Library, v. 28, n. 1, p. 137–152, 1990.
  • [Kiani, Mahdavi e Keshavarzi 2015] KIANI, R.; MAHDAVI, S.; KESHAVARZI, A. Analysis and prediction of crimes by clustering and classification. Analysis, Citeseer, v. 4, n. 8, 2015.
  • [Kinney et al. 2008] KINNEY, J. B. et al. Crime attractors, generators and detractors: land use and urban crime opportunities. Built environment, Alexandrine Press, v. 34, n. 1, p. 62–74, 2008.
  • [Kleiber 1932] KLEIBER, M. Body size and metabolism. ENE, v. 1, p. E9, 1932.
  • [Kleiber et al. 1961] KLEIBER, M. et al. The fire of life. an introduction to animal energetics. The fire of life. An introduction to animal energetics., John Wiley & Sons, Inc., New York: London, 1961.
  • [Lam e Lo 1991] LAM, W. H.; LO, H. Estimation of origin-destination matrix from traffic counts: a comparison of entropy maximizing and information minimizing models. Transportation Planning and Technology, Taylor & Francis, v. 16, n. 2, p. 85–104, 1991.
  • [Lambiotte et al. 2008] LAMBIOTTE, R. et al. Geographical dispersal of mobile communication networks. Physica A: Statistical Mechanics and its Applications, Elsevier, v. 387, n. 21, p. 5317–5325, 2008.
  • [Lauritsen e Quinet 1995] LAURITSEN, J. L.; QUINET, K. F. D. Repeat victimization among adolescents and young adults. Journal of Quantitative Criminology, Springer, v. 11, n. 2, p. 143–166, 1995.
  • [Leitão et al. 2016] LEITÃO, J. C. et al. Is this scaling nonlinear? Royal Society Open Science, The Royal Society, v. 3, n. 7, 2016.
  • [Li e Racine 2004] LI, Q.; RACINE, J. Cross-validated local linear nonparametric regression. Statistica Sinica, v. 14, n. 2, p. 485–512, 2004.
  • [Liang et al. 2013] LIANG, X. et al. Unraveling the origin of exponential law in intra-urban human mobility. arXiv preprint arXiv:1305.6364, 2013.
  • [Makse et al. 1998] MAKSE, H. A. et al. Modeling urban growth patterns with correlated percolation. Physical Review E, APS, v. 58, n. 6, p. 7054, 1998.
  • [Makse, Havlin e Stanley 1995] MAKSE, H. A.; HAVLIN, S.; STANLEY, H. E. Modelling urban growth patterns. Nature, Nature Publishing Group, v. 377, n. 6550, p. 608, 1995.
  • [Malleson e Andresen 2015] MALLESON, N.; ANDRESEN, M. A. The impact of using social media data in crime rate calculations: shifting hot spots and changing spatial patterns. Cartography and Geographic Information Science, Taylor & Francis, v. 42, n. 2, p. 112–121, 2015.
  • [Melo, Belchior e Furtado 2005] MELO, A.; BELCHIOR, M.; FURTADO, V. Analyzing police patrol routes by simulating the physical reorganization of agents. In: SPRINGER. International Workshop on Multi-Agent Systems and Agent-Based Simulation. [S.l.], 2005. p. 99–114.
  • [Melo et al. 2014] MELO, H. P. M. et al. Statistical signs of social influence on suicides. Scientific reports, Nature Publishing Group, v. 4, 2014.
  • [Messner e Tardiff 1985] MESSNER, S. F.; TARDIFF, K. The social ecology of urban homicide: An application of the “routine activities” approach. Criminology, Wiley Online Library, v. 23, n. 2, p. 241–267, 1985.
  • [Michael e Adler 1933] MICHAEL, J.; ADLER, M. Crime, law and social science. [S.l.]: K. Paul, Trench, Trubner & co. ltd., 1933. (International library of psychology, philosophy, and scientific method).
  • [Montgomery, Peck e Vining 2015] MONTGOMERY, D. C.; PECK, E. A.; VINING, G. G.

    Introduction to linear regression analysis

    . [S.l.]: John Wiley & Sons, 2015.
  • [Murcio, Sosa-Herrera e Rodriguez-Romo 2013]

    MURCIO, R.; SOSA-HERRERA, A.; RODRIGUEZ-ROMO, S. Second-order metropolitan urban phase transitions.

    Chaos, Solitons & Fractals, Elsevier, v. 48, p. 22–31, 2013.
  • [Nadaraya 1964] NADARAYA, E. A. On estimating regression.

    Theory of Probability & Its Applications

    , SIAM, v. 9, n. 1, p. e0171609, 1964.
  • [Naroll e Bertalanffy 1956] NAROLL, R. S.; BERTALANFFY, L. V. The principle of allometry in biology and the social sciences. General systems yearbook, v. 1, n. Part II, p. 76–89, 1956.
  • [Newling 1966] NEWLING, B. E. Urban growth and spatial structure: mathematical models and empirical evidence. Geographical Review, JSTOR, p. 213–225, 1966.
  • [Nogueira et al. 2001] NOGUEIRA, R. M. R. et al. Dengue virus type 3 in rio de janeiro, brazil. Memórias do Instituto Oswaldo Cruz, SciELO Brasil, v. 96, n. 7, p. 925–926, 2001.
  • [Oliveira, Andrade e Makse 2014] OLIVEIRA, E. A.; ANDRADE, J. S.; MAKSE, H. A. Large cities are less green. Scientific reports, Nature Publishing Group, v. 4, 2014.
  • [Park et al. 1991] PARK, D. C. et al. Electric load forecasting using an artificial neural network. IEEE transactions on Power Systems, IEEE, v. 6, n. 2, p. 442–449, 1991.
  • [Pizarro, Corsaro e Yu 2007] PIZARRO, J. M.; CORSARO, N.; YU, S.-s. V. Journey to crime and victimization: An application of routine activities theory and environmental criminology to homicide. Victims and Offenders, Taylor & Francis, v. 2, n. 4, p. 375–394, 2007.
  • [Pokorny 1965] POKORNY, A. D. A comparison of homicides in two cities. The Journal of Criminal Law, Criminology, and Police Science, JSTOR, v. 56, n. 4, p. 479–487, 1965.
  • [Press et al. 1987] PRESS, W. H. et al. Numerical recipes: the art of scientific computing. [S.l.]: AIP, 1987.
  • [Puga 2010] PUGA, D. The magnitude and causes of agglomeration economies. Journal of Regional Science, Wiley Online Library, v. 50, n. 1, p. 203–219, 2010.
  • [Racine e Li 2004] RACINE, J.; LI, Q. Nonparametric estimation of regression functions with both categorical and continuous data. Journal of Econometrics, v. 119, n. 1, p. 99–130, 2004.
  • [Ralston e Rabinowitz 2001] RALSTON, A.; RABINOWITZ, P. A first course in numerical analysis. [S.l.]: Courier Corporation, 2001.
  • [Rameaux e Sarrus 1838] RAMEAUX, J.; SARRUS, F. Rapport sur un mémoire adressé al’académie royale de médecine. Bull. Acad. Méd., Paris, v. 3, p. 1094–1100, 1838.
  • [Rand 1986] RAND, A. Mobility triangles. Metropolitan crime patterns, Criminal Justice Press Monsey, NY, p. 117–126, 1986.
  • [Ratcliffe 2006] RATCLIFFE, J. H. A temporal constraint theory to explain opportunity-based spatial offending patterns. Journal of Research in Crime and Delinquency, Sage Publications, v. 43, n. 3, p. 261–291, 2006.
  • [Rawlings, Pantula e Dickey 2001] RAWLINGS, J. O.; PANTULA, S. G.; DICKEY, D. A. Applied regression analysis: a research tool. [S.l.]: Springer Science & Business Media, 2001.
  • [Remya e Mathew 2013] REMYA, K.; MATHEW, S. Od matrix estimation from link counts using artificial neural network. CONTRIBUTORY PAPERS, p. 287, 2013.
  • [Rengert 2004] RENGERT, G. F. The journey to crime. Bruinsma, G., Elffers, H., Willem, J., de Keijser (eds.) Punishment, Places, and Perpetrators: Developments in Criminology and Criminal Justice Research, p. 169–181, 2004.
  • [Rozenfeld et al. 2008] ROZENFELD, H. D. et al. Laws of population growth. Proceedings of the National Academy of Sciences, National Acad Sciences, v. 105, n. 48, p. 18702–18707, 2008.
  • [Rozenfeld et al. 2011] ROZENFELD, H. D. et al. The area and population of cities: New insights from a different perspective on cities. The American Economic Review, American Economic Association, v. 101, n. 5, p. 2205–2225, 2011.
  • [Rubner 1883] RUBNER, M. Ueber den einfluss der korpergrosse auf stoffund kaftwechsel. Zeitschrift fur Biologie, v. 19, p. 535–562, 1883.
  • [Sampson e Raudenbush 1999] SAMPSON, R. J.; RAUDENBUSH, S. W. Systematic social observation of public spaces: A new look at disorder in urban neighborhoods 1. American journal of sociology, The University of Chicago Press, v. 105, n. 3, p. 603–651, 1999.
  • [Schoenberg 1973] SCHOENBERG, I. J.

    Cardinal spline interpolation

    . [S.l.]: SIAM, 1973.
  • [Sherman 1995] SHERMAN, L. W. Hot spots of crime and criminal careers of places. Crime and place, Willow Tree Press, Monsey, NY, v. 4, p. 35–52, 1995.
  • [Sherman, Gartin e Buerger 1989] SHERMAN, L. W.; GARTIN, P. R.; BUERGER, M. E. Hot spots of predatory crime: Routine activities and the criminology of place. Criminology, Wiley Online Library, v. 27, n. 1, p. 27–56, 1989.
  • [Short et al. 2010] SHORT, M. B. et al. Dissipation and displacement of hotspots in reaction-diffusion models of crime. Proceedings of the National Academy of Sciences, National Acad Sciences, v. 107, n. 9, p. 3961–3965, 2010.
  • [Short et al. 2008] SHORT, M. B. et al. A statistical model of criminal behavior. Mathematical Models and Methods in Applied Sciences, World Scientific, v. 18, n. supp01, p. 1249–1267, 2008.
  • [Simini et al. 2010] SIMINI, F. et al. Self-similarity and scaling in forest communities. Proceedings of the National Academy of Sciences, National Acad Sciences, v. 107, n. 17, p. 7658–7662, 2010.
  • [Song et al. 2010] SONG, C. et al. Limits of predictability in human mobility. Science, American Association for the Advancement of Science, v. 327, n. 5968, p. 1018–1021, 2010.
  • [Stanley 1971] STANLEY, H. E. Phase transitions and critical phenomena. Clarendon, Oxford, p. 9, 1971.
  • [Stauffer e Aharony 1994] STAUFFER, D.; AHARONY, A. Introduction to percolation theory. [S.l.]: CRC press, 1994.
  • [Strogatz 2001] STROGATZ, S. H. Exploring complex networks. Nature, Nature Publishing Group, v. 410, n. 6825, p. 268–276, 2001.
  • [Sullivan et al. 2017] SULLIVAN, D. et al. Towards understanding the impact of crime in a choice of a route by a bus passenger. arXiv, arXiv:1705.03506, 2017. Disponível em: https://arxiv.org/abs/1705.03506.
  • [Taylor e Harrell 1996] TAYLOR, R. B.; HARRELL, A. Physical environment and crime. [S.l.]: US Department of Justice, Office of Justice Programs, National Institute of Justice, 1996.
  • [Tella e Schargrodsky 2004] TELLA, R. D.; SCHARGRODSKY, E. Do police reduce crime? estimates using the allocation of police forces after a terrorist attack. The American Economic Review, American Economic Association, v. 94, n. 1, p. 115–133, 2004.
  • [Tita e Griffiths 2005] TITA, G.; GRIFFITHS, E. Traveling to violence: The case for a mobility-based spatial typology of homicide. Journal of Research in Crime and Delinquency, Sage Publications Sage CA: Thousand Oaks, CA, v. 42, n. 3, p. 275–308, 2005.
  • [Wand 1997] WAND, M. Data-based choice of histogram bin width. The American Statistician, Taylor & Francis, v. 51, n. 1, p. 59–64, 1997.
  • [Wang 2005] WANG, F. Geographic information systems and crime analysis. [S.l.]: IGI Global, 2005.
  • [Wang et al. 2009] WANG, P. et al. Understanding the spreading patterns of mobile phone viruses. Science, American Association for the Advancement of Science, v. 324, n. 5930, p. 1071–1076, 2009.
  • [Wang 2003] WANG, S.-C. Artificial neural network. In: Interdisciplinary computing in java programming. [S.l.]: Springer, 2003. p. 81–100.
  • [Wang et al. 2013] WANG, T. et al. Learning to detect patterns of crime. In:         . Machine Learning and Knowledge Discovery in Databases: European Conference, ECML PKDD 2013, Prague, Czech Republic, September 23-27, 2013, Proceedings, Part III. Berlin, Heidelberg: Springer Berlin Heidelberg, 2013. p. 515–530. ISBN 978-3-642-40994-3.
  • [Wartell e Vigne 2004] WARTELL, J.; VIGNE, N. G. L. Prescription fraud. [S.l.]: US Department of Justice, Office of Community Oriented Policing Services, 2004.
  • [Watson 1964] WATSON, G. S. Smooth regression analysis. Sankhyā: The Indian Journal of Statistics, Series A, JSTOR, p. 359–372, 1964.
  • [Weisburd e Braga 2006] WEISBURD, D.; BRAGA, A. A. Police innovation: Contrasting perspectives. [S.l.]: Cambridge University Press, 2006.
  • [Wilson e Kelling 1982] WILSON, J. Q.; KELLING, G. L. Broken windows. Critical issues in policing: Contemporary readings, p. 395–407, 1982.
  • [Woldenberg 1973] WOLDENBERG, M. J. An allometric analysis of urban land use in the united states. Ekistics, JSTOR, p. 282–290, 1973.
  • [Wortley e Townsley 2016] WORTLEY, R.; TOWNSLEY, M. Environmental criminology and crime analysis. [S.l.]: Routledge, 2016.
  • [Zimbardo 1969] ZIMBARDO, P. G. The human choice: Individuation, reason, and order versus deindividuation, impulse, and chaos. In: UNIVERSITY OF NEBRASKA PRESS. Nebraska symposium on motivation. [S.l.], 1969.
  • [Zipf 1950] ZIPF, G. K. Human behavior and the principle of least effort. [S.l.]: JOHN WILEY & SONS INC 111 RIVER ST, HOBOKEN, NJ 07030 USA, 1950.