LOXODATA

De retour du FOSDEM 2017

2017-02-06   875 mots, 5 minutes de lecture   Lætitia Avrot

J’ai participé avec beaucoup de plaisir au FOSDEM PGDay 2017 le 3 février ainsi qu’au FOSDEM en lui-même les 4 et 5 février.

Que ce soit le 3 ou le 5 février, les places pour assister à une conférence étaient chères. Il a fallu arriver en avance pour pouvoir suivre ce qu’on voulait. Cela s’est très bien passé dans la bonne humeur et sans jouer des coudes, car c’est connu, les geeks sont des gentils.

La fonctionnalité phare de ce FOSDEM est sans conteste la réplication logique qui sera intégrée à PostgreSQL 10. On a aussi beaucoup entendu parler de l’incident GitLab.

PGDAY, le 3 février 2017

Cette journée se déroule avant le FOSDEM en lui-même. L’accès aux conférences se faisait sur réservation. La bonne nouvelle, c’est qu’il n’y avait qu’une seule salle donc il n’était pas possible d’être déchiré entre deux conférences über-importantes se déroulant en même temps!

  • Logical Replication in PostgreSQL par Petr Jelinek Cette conférence avait déjà eu lieu à Tallin l’année dernière. La réplication logique native de PostgreSQL 10 est basée sur pgLogical. C’était donc d’autant plus intéressant d’avoir les explications détaillées de 2nd Quadrant, qui est à l’origine du projet.

  • Corruption War Stories par Christophe Pettus Après avoir détaillé les raisons pour lesquelles un fichier peut-être corrompu, Christophe a proposé certaines méthodes suivant le type de fichier atteint par la corruption. Selon moi, l’idée qu’il a voulu faire passer, c’est que quoi qu’il arrive, il est toujours possible d’empirer la situation. ;-)

  • CCP: Containerized Clustered Postgres par Josh Berkus Cette conférence est peut-être celle qui m’a le plus intéressée alors qu’au départ, ce n’est pas celle que j’attendais le plus. Tout d’abord, Josh sait raconter des histoires et tenir un auditoire en haleine. De plus, son idée, qui n’en est qu’à ses prémisses, me semble très prometteuse. Elle permet de gérer un cluster de plusieurs instances PostgreSQL conteneurisée. Le custer conteneurisé est basé sur le projet Atomic. Les instances peuvent ensuite être pilotées depuis un seul serveur pour faire du monitoring, de la haute disponibilité, du load balancing, du sharding… Le champ des possibles est immense!

  • The ninja elephant, scaling analytics database in Transwerwise par Federico Campoli Federico Campoli a présenté un cas concret de réplication logique de mySQL vers PostgreSQL. Au départ, sa mission était d’améliorer les performances des traitements analytiques sur la base mySQL. Il est rapidement arrivé à la conclusion que mySQL arrivait à ses limites. Une fois le choix de passer la base en PostgreSQL acté, il a développé un outil basé sur pg_chameleon qui peut maintenir une réplication logique entre une base mySQL et une base PostgreSQL, tout en chiffrant les données à la volée.

  • Creating index … Using RUM par Alexander Korotkov Le but était d’améliorer les index GIN (Full Text Search) en permettant un ranking des mots clés recherchés pour avoir des résultats plus pertinents.

  • WAL for DBAs par Devrim Gündüz Étant donné l’importance de la réplication logique, une piqûre de rappel sur les bases est toujours appréciable. Cette conférence était très généraliste et un informaticien non DBA aurait pu la suivre sans problème. Certains pourraient considérer que c’est une perte de temps, mais Devrim est un très bon orateur (donc on passe un bon moment) et ensuite ça permet de ne pas oublier ce qu’on sait. :-)

  • PostgreSQL worst practices par Ilya Kosmodemiansky Cela fait quelques temps qu’Ilya compile le pire du pire de ce qu’il a rencontré (ou qu’on lui a rapporté) avec des bases PostgreSQL. Sa « base de données » des pires pratiques se compose d’une centaine de slides parmi lesquelles il en pioche 10 au hasard juste avant la conférence elle-même, ce qui rend cette conférence toujours unique. Pratiques exotiques et fous rires assurés!

FOSDEM, les 4 et 5 février 2017

Là encore, une forte d’affluence sur les conférences liées au big data et à PostgreSQL. Pour ceux qui sont restés à la porte, il était possible de visualiser la vidéo en live.

  • Beyond trust – PostgreSQL Client Authentication par Christoph Mönch-Tegeder Après avoir expliqué les bases (différence entre authentification et identification, importance de la sécurité, bonnes pratiques…), Christophe a fait l’inventaire des 13 méthodes d’authentification possibles pour accéder à postegrSQL. Très intéressant.

  • Tour de Data Types par Andreas Scherbaum Saviez-vous qu’il y a 82 types de données différents dans PostgreSQL dont 41 d’utilisation courante? Pourquoi trouve-t-on des CHAR(255)? Quel type de données utiliser pour stocker des données monétaires? Quel encodage est utilisé quand on stocke du XML? Sur un sujet qui semble connu de tous, Andreas nous a montré qu’il y avait encore des subtilités qui peuvent nous échapper.

  • Evolution of Fault Tolerance in PostgreSQL par Gülçin Yildirim Dans un panorama très complet, Gülçin a abordé la (pré)histoire des WAL pour arriver aux différentes méthodes de backup et de réplication aujourd’hui. Elle s’est montrée très enthousiaste également sur le futur en parlant de la réplication logique native et de réplications maître-maître.

  • An overview of PostgreSQL’s backup archiving and replication par Gunnar Bluth (dit « Nick ») Une nouvelle conférence sur le sujet, mais là encore abordée suivant un angle différent. Le but de Nick dans cette conférence est de partager les pièges qu’il a rencontrés dans sa carrière sur ces sujets. C’était assez enrichissant.

J’ai passé un excellent et enrichissant week-end à Bruxelles. A l’année prochaine, Bruxelles!