13
août

L'algorithme PageRank pour les nuls : comment mesurer la popularité d'une page web ?

En 1998, deux jeunes doctorants de l'université de Stanford, Larry Page et Sergey Brin (en collaboration avec Motwani et Wynograd) publiaient un article intitulé "The PageRank Citation Ranking: Bringing Order to the Web" présentant les résultats d'un nouvel algorithme permettant de classer les pages web selon leur popularité et montrant la précision de cet [...]

09
juin

Utiliser CartoDB pour visualiser des données de géolocalisation

Si vous avez lu l'article "Géolocalisation : Comment trouver les coordonnées GPS latitude-longitude d'une adresse ou d'un lieu ?", vous savez désormais comment trouver la latitude et la longitude d'une adresse quelconque. Mais maintenant, comment réaliser une belle cartographie en utilisant les données extraites précédemment ? Et bien pour cela, nou [...]

09
juin

Géolocalisation : Comment trouver les coordonnées GPS latitude-longitude d'une adresse ou d'un lieu ?

Avant de pouvoir réaliser une belle cartographie en plaçant différents lieux sur une carte du monde, il est nécessaire dans un premier temps d'obtenir les coordonnées GPS pour chacune des entités à placer . Que ce soit à partir d'une adresse exacte, d'un code postal, du nom d'une ville ou bien à partir du nom d'un lieu, l'idée e [...]

19
mai

La Twittosphère #DataScience Française : Cartographie et Trending Topics via l'API Twitter

Fraichement débarqué dans le monde merveilleux de la science des données, le Captain' s'est retrouvé un peu paumé, en ne sachant pas vraiment comment identifier les acteurs intéressants dans le milieu et comment être à peu près au courant de ce qu'il se passe. Twitter est en général un excellent moyen pour se tenir inform& [...]

14
mai

Mapping Python Community on Twitter : a Network Analysis using Gephi and ... Python !

Using Twython, a Python wrapper for the Twitter API, I first start by extracting all the Twitter accounts followed by the official Twitter account of the Python Software Foundation (@ThePSF). The PSF Twitter account is followed by 74000+ users, and follows 127 other accounts, mainly regional or national Python group all over the world (@londonpython, @python_madrid, @PythonItalia...), Python confe [...]

11
mai

Identifier les personnes et personnalités dans une chaîne de caractère : une application simple

Si le Captain' vous demande quelles sont les personnes ou personnalités citées dans un article donné, par exemple dans l'article "Le chômage handicape la reprise européenne", cette tâche est pour votre cerveau assez simple et un enfant de moins de 10 ans peut y arriver sans trop de problème. Par exemple dans l'exemple ci-dessus, la bonne répons [...]

07
mai

Identifier la couleur d'un pixel ou la couleur dominante d'une image : pourquoi et comment

Mais Captain', à quoi cela peut servir d'identifier la couleur dominante d'une image ou bien la couleur précise d'un pixel. Et bien bizarrement à pas mal de choses ! Par exemple si vous êtes fashion designer et que vous souhaitez identifier les tendances de la prochaine collection, analyser les photos d'un grand nombre de personnalités influentes peut vous donner [...]

29
avril

Twitter Earnings Leak: A High-Frequency Analysis Using One-Minute Market Data And Tweet Volume

Yesterday, Twitter should have published its quarterly results just after the bell around 4.pm  (when markets are closed) . But things have not quite turned out as planned! At 3:07 pm, a company named Selerity Corp has published a series of four tweets containing  information about Twitter earnings, approximatively one hour before the official figures. Leak? Hack? Not exactly ! Sele [...]

24
avril

The Top Fashion Influencers on Instagram and Twitter : an Algorithmic Approach

Identifying online influencer has become a key issue for brands to communicate abour their products or services (Booth et al., 2011). In this article, we provide a new methodology to identify influencers and we apply our findings to a specific topic : fashion. Why studying fashion ? In only few years, fashion bloggers have emerged as major players for fashion brands communication. A good indicator [...]

22
avril

UMP - PS : Cartographie de la Twittosphère Politique, Influence et Achat de Followers

Il y a une petite semaine, le magazine Challenges publiait un article intitulé "Twitter, Facebook, Instagram: le business de l'audience fictive" en dénonçant le business de l'achat de faux abonnés sur les réseaux sociaux et la notoriété digitale artificielle. Afin de réaliser un classement du top 5 des personnalités politiques aya [...]