Structural Polarization and community formation in French Political Twitter

par Muhammad umer Gurchani

Projet de thèse en Science Politique

Sous la direction de Jean-Yves Dormagen.

Thèses en préparation à Montpellier , dans le cadre de Ecole doctorale Droit et science politique , en partenariat avec CEPEL - Centre d'Etudes Politiques de l'Europe Latine (laboratoire) depuis le 05-10-2016 .


  • Résumé

    L'objectif de cette thèse est d'identifier les schémas comportementaux chez les adeptes de twitter des principaux politiciens français. Je répartirai les partisans de chacun de ces politiciens dans les catégories suivantes pour chacun des principaux politiciens français: Amis actifs Neutres Actifs Amis semi-actifs Neutres semi-actifs Comptes politiquement dormants Comptes complètement dormants Méthodologie: La première étape consiste à identifier les principaux comptes Twitter dans l'espace politique de la France que nous voulons impliquer dans cette analyse. Ces comptes Twitter doivent appartenir soit à un parti politique de premier plan, soit à une personnalité politique dans la vie réelle. Il convient également de s'assurer que les comptes en question sont authentiques, soit en vérifiant qu'ils ont été vérifiés par twitter, soit qu'ils ont été mentionnés par les partisans vérifiés de la même organisation politique. Pour cette recherche, je limiterai mon champ d'action aux adeptes de twitter des quatre premiers candidats au premier tour des élections présidentielles françaises de 2017. 1. Emmanuel Macron 2. Marine Le Pen 3. François Fillon 4. Jean-Luc Mélenchon La première étape de la recherche consistera à collecter sur Twitter une liste complète des partisans des politiciens susmentionnés. De plus, je rassemblerai également des données sur les tweets de ces politiciens. Ces données incluront toutes les informations fournies par Twitter sur les tweets de ces comptes. En utilisant ces données, je créerai des catégories parmi les adeptes des politiciens mentionnés ci-dessus. Vous trouverez ci-après les méthodes spécifiques utilisées pour chacune de ces catégories. Amis actifs et semi-actifs: Les amis actifs des politiciens sont définis comme des partisans des politiciens qui sont très actifs sur Twitter et interagissent fréquemment avec les politiciens en question. Il est important de connaître ces personnes car elles s'avèrent très utiles pour faire passer le message lors d'une campagne politique. Pour identifier les amis actifs d'une personnalité politique sur Twitter, je décortiquerai les tweets du politicien. Tout d'abord, je vais examiner les 1000 derniers tweets de ce politicien et voir qui les a retweetés régulièrement et qui les a aimés fréquemment. Cela déterminera si un certain compte donne de l'importance à l'opinion de la personnalité politique en question ou non. Une fois que l'on aura découvert qui était activement engagé sur le compte Twitter de ce politicien, il sera désormais important de savoir s'ils sont exclusivement amicaux envers le politicien ou non. Comme il pourrait y en avoir beaucoup, engagez des comptes Twitter qui retweetent les opinions d'autres politiciens. Pour déterminer si un compte est un ami exclusif du politicien en question, nous devons examiner les comptes des politiciens opposés et voir si les comptes en question les retweetent eux aussi fortement. Si la réponse se révèle non, alors nous aurons une meilleure chance que le compte soit un ami de notre politicien. Et si la réponse est oui, un examen qualitatif du compte sera nécessaire pour déterminer si le compte est un ami de notre politicien ou non. La même procédure peut être répétée pour le goût des tweets. Si un compte Twitter est exclusivement destiné à aimer les tweets d'un certain politicien, il est plus susceptible d'être son supporter. Neutre actif et semi-actif: Les neutres actifs sont définis comme des comptes actifs dans la sphère politique française, mais ils ne soutiennent aucunement les politiciens. Le premier test de neutralité sera basé sur l'idée qu'un utilisateur neutre est susceptible de suivre différents politiciens de tout le spectre. Alors qu'il n'est pas nécessaire que toutes les personnes qui suivent des politiciens différents soient relativement neutres en ce qui concerne leurs inclinations politiques. Une indication claire de la neutralité du compte sera qu'il manifestera un comportement similaire vis-à-vis de plusieurs politiciens impliqués. S'ils aiment ou retweetent l'un des politiciens, ils devraient faire la même chose pour les autres politiciens. Des comptes politiquement inactifs: Les comptes inactifs sont ceux qui n'utilisent pas Twitter à des fins politiques. Cela signifie qu'ils suivent les politiciens mais ne tweetent pas, retweetent ou n'aiment aucun des tweets des comptes politiques. Ils utilisent uniquement Twitter à des fins non politiques. La manière dont cette catégorie de comptes peut être identifiée est que nous allons prendre les adeptes des politiciens en utilisant l'API de Twitter et parmi ces comptes suiveurs, nous examinerons leur engagement avec tous les politiciens éminents. Si certains comptes ne font que suivre les politiciens et ne s'engagent pas avec eux, nous examinerons plus avant leur activité et s'ils ont été actifs autrement et engagés dans d'autres comptes non politiques, il sera alors possible de les classer en sommeil politique. comptes. Comptes complètement dormants: Il existe également un grand nombre de comptes Twitter qui suivent des politiciens et ne sont pas actifs du tout. Ils ne s'engagent ni avec les politiciens

  • Titre traduit

    Structural Polarization and community formation in French Political Twitter


  • Résumé

    The goal of this Phd is to identify the behavioral patterns in the twitter followers of major French politicians. I will be dividing the followers of each of these politicians into following categories for each of the major French politicians: Active Friends Active Neutrals Semi Active Friends Semi Active Neutrals Politically dormant accounts Completely dormant accounts Methodology: The first step is to identify the major twitter accounts in political space of France that we want to involve in this analysis. These twitter accounts should belong either to a prominent Political Party or to a Political Personality in real life. It should also be made sure that the accounts in question are authentic either by seeing if they have been verified by twitter or mentioned by the verified supporters of the same political organization. For this research, I will limit my scope to twitter followers of top four contenders of first round of French presidential elections of 2017. 1. Emmanuel Macron 2. Marine Le Pen 3. François Fillon 4. Jean-Luc Mélenchon The first step of research will be to collect fully hydrated, list of followers of above-mentioned politicians on twitter. In addition to that, I will also gather data on the tweets of these politicians. This data will include all the information twitter api provides on tweets from these accounts. Using this data, I will create categories among the followers of above-mentioned politicians. Following will be the specific methods used for each of these categories. Active and Semi-Active Friends: Active friends of politicians are defined as supporters of politicians who are very active on twitter and frequently engage with the politicians in question. It is important to know about these people because they prove to be very instrumental when it comes to spreading the word during a political campaign. To identify the active friends of a political figure in twitter, I will dissect the tweets by the politician. First, I will looks into last 1000 tweets by that politician and see who has been retweeting them on regular basis and who has been liking them frequently. This will determine if a certain account give importance to the opinion of the political figure in question or not. Once it has been found who has been actively engaged with the twitter account of that politician, it will now be important to find out if they are exclusively friendly towards the politician or not. As there might be many actively, engage twitter accounts whose are retweeting the opinions of other politicians too. To determine if an account is an exclusive friend of the politician in question we have to look into the accounts of the opposing politicians and see if the accounts in question are also heavily retweeting them too. If the answer comes out to be no, then we will have a better likely hood that the account is a friend of our politician. And if the answer comes out to be yes, then a qualitative look into the account will be needed to determine if the account is a friend of our politician or not. The same procedure can be repeated for liking of the tweets. If a twitter account is exclusively dedicated to liking a certain politician's tweets then he is more likely to be his supporter. Active and Semi-Active Neutrals: Active neutrals are defined as accounts that are active in French political sphere but they are not vehement supporters of any of the politicians. The first test of neutrality will be based on the idea that a neutral user is likely to follow different politicians from the whole spectrum. Whereas, it is not necessary that all the people who follow different politicians will be relatively neutral in terms of their political inclinations. A clear indication of an account being actively neutral will be that he/she shows similar behavior towards multiple politicians involved. If they like or retweet one of the politicians, they should be doing the same for other politicians too. Politically Dormant Accounts: Dormant accounts are the ones who have not been using twitter for any of the political purposes. This means that they follow the politicians but do not tweet, retweet or like any of the tweets from the political accounts. They only use twitter for non-political purposes. The way in which this category of accounts can be identified is that we will be taking the followers of the politicians using twitter API and among those follower accounts we will be looking into their engagement with all the prominent politicians. If there are some accounts that just follow the politicians and do not engage with them, we will further look into their activity and if they have been active otherwise and engaged with other non-political accounts then it will be possible to categorize them into politically dormant accounts. Completely Dormant Accounts: There are also a large number of twitter account following politicians and not active at all in any way. They neither engage with politicians and nor with the non-political accounts. It is easy to identify these accounts using twitter API information collected from the twitter page of the politicians and then checking the profiles of the users following them. If they have not tweeted or retweeted in a long time (more than 6 months) and they have not liked any status for more than 6 months, then it can be said that they are dormant account. The significance of these dormant accounts lies in their numbers. It would be interesting to find out what percentage of the accounts following these politicians are actually completely dormant accounts. Behavioral Indicators we will look into Following are the areas in each of the categories that we will look into to find out more about the behavioral patterns. Treating twitter as Information Network or Social Network In each of the categories for every politician, I will try to see if twitter is behaving as a social network or an information network. For this purpose, I will create a network graph (based on follow relationships) for each of the above categories and try to see following aspects of the network: • Clustering Coefficient • Reciprocity • Degree assortativity The values of the above-mentioned variables will help me determine how the network is acting within these groups. A typical social network has Clustering Coefficient, High Reciprocity and high degree assortativity. Where as in a typical informational network, all these variables tend to have lower values. The control group for this experiment will be established using a sample from the list of all the followers of the concerned politicians. What triggers shifts in choice of candidates In one of the major categories (Active/semi-active neutrals), it will be important to find out if there was a change in choice of politician by these accounts and what triggered this change in opinion. As mentioned above this change in opinion will be established using retweets as means. If an account had been retweeting one politician for a certain time and then switched to retweeting another politician, it will be important to know when this change occurred and why? It will also be important to know, who are the influential nodes in this network and does the in-degree accurately correlate with the ability to change opinions. Why is this research important ? High-clusterization of similar profiles on twitter prevents us from drawing better conclusions from the twitter data that can useful in real world. So far, researchers have only used tweets as means for making predictions about real world on twitter. Here I intend to use tweet data in addition to network graphs to see if it is possible to draw more meaningful conclusions.