From 4a7f909275e353d345e6ef22838d082d82735893 Mon Sep 17 00:00:00 2001 From: Arnaud Levy <contact@arnaudlevy.com> Date: Thu, 7 Oct 2021 11:09:49 +0200 Subject: [PATCH] import --- docs/websites/import.md | 67 +++++++++++++++++++++++++++++++++++++++++ 1 file changed, 67 insertions(+) create mode 100644 docs/websites/import.md diff --git a/docs/websites/import.md b/docs/websites/import.md new file mode 100644 index 000000000..daa86d4db --- /dev/null +++ b/docs/websites/import.md @@ -0,0 +1,67 @@ +# Import + +## Contexte + +L'objectif est de fluidifier la transition depuis un site déjà en place, notamment WordPress. Deux approches sont possibles : interne, avec un accès BDD, et externe, en passant par le site lui-même. Nous privilégierons l'approche externe dans un premier temps, pour permettre l'approche avant-vente (présenter un site pré-migré). + +## Problématiques + +1. Détection des pages +2. Extraction des contenus bruts +3. Distingo entre pages et posts, et autres types d'objets +4. Identification des menus + +## Approche externe + +Plusieurs possibilités : +- le crawling +- le sitemap +- le flux RSS +- l'api + +## Approche interne + +Plugin, connexion à la BDD, export JSON ou connexion API. + +## Développement + +Communication::Website::Imported::Website +- university:references +- website:references (has_one Communication::Website) +- page:references (has_one Communication::Website::Page) +- status:integer (enum) + +Communication::Website::Imported::Page +- university:references +- website:references (has_one Communication::Website::Imported::Website) +- page:references (has_one Communication::Website::Page) +- status:integer (enum) + +Etapes : +1. Création du site, avec son URL +2. Lancement de l'import (création de Communication::Website::Imported::Website) +3. Import des sitemaps (création de Communication::Website::Imported::Page) +4. Import du contenu brut des pages importées +5. Analyse du contenu des pages importées et création / mise à jour des pages + +## Exemples + +### Condé + +- https://ecoles-conde.com/sitemap_index.xml +- https://ecoles-conde.com/wp-json/wp/v2/posts +- https://ecoles-conde.com/wp-json/wp/v2/pages + +### IUT Bordeaux Montaigne + +- https://www.iut.u-bordeaux-montaigne.fr/wp-sitemap.xml +- https://www.iut.u-bordeaux-montaigne.fr/wp-sitemap-posts-post-1.xml +- https://www.iut.u-bordeaux-montaigne.fr/wp-sitemap-posts-page-1.xml +- https://www.iut.u-bordeaux-montaigne.fr/wp-json/wp/v2/posts +- https://www.iut.u-bordeaux-montaigne.fr/wp-json/wp/v2/pages + + +## Recherches + +https://kinsta.com/fr/blog/api-rest-wordpress/ +https://getshifter.io/ -- GitLab