From 4a7f909275e353d345e6ef22838d082d82735893 Mon Sep 17 00:00:00 2001
From: Arnaud Levy <contact@arnaudlevy.com>
Date: Thu, 7 Oct 2021 11:09:49 +0200
Subject: [PATCH] import

---
 docs/websites/import.md | 67 +++++++++++++++++++++++++++++++++++++++++
 1 file changed, 67 insertions(+)
 create mode 100644 docs/websites/import.md

diff --git a/docs/websites/import.md b/docs/websites/import.md
new file mode 100644
index 000000000..daa86d4db
--- /dev/null
+++ b/docs/websites/import.md
@@ -0,0 +1,67 @@
+# Import
+
+## Contexte
+
+L'objectif est de fluidifier la transition depuis un site déjà en place, notamment WordPress. Deux approches sont possibles : interne, avec un accès BDD, et externe, en passant par le site lui-même. Nous privilégierons l'approche externe dans un premier temps, pour permettre l'approche avant-vente (présenter un site pré-migré).
+
+## Problématiques
+
+1. Détection des pages
+2. Extraction des contenus bruts
+3. Distingo entre pages et posts, et autres types d'objets
+4. Identification des menus
+
+## Approche externe
+
+Plusieurs possibilités :
+- le crawling
+- le sitemap
+- le flux RSS
+- l'api
+
+## Approche interne
+
+Plugin, connexion à la BDD, export JSON ou connexion API.
+
+## Développement
+
+Communication::Website::Imported::Website
+- university:references
+- website:references (has_one Communication::Website)
+- page:references (has_one Communication::Website::Page)
+- status:integer (enum)
+
+Communication::Website::Imported::Page
+- university:references
+- website:references (has_one Communication::Website::Imported::Website)
+- page:references (has_one Communication::Website::Page)
+- status:integer (enum)
+
+Etapes :
+1. Création du site, avec son URL
+2. Lancement de l'import (création de Communication::Website::Imported::Website)
+3. Import des sitemaps (création de Communication::Website::Imported::Page)
+4. Import du contenu brut des pages importées
+5. Analyse du contenu des pages importées et création / mise à jour des pages
+
+## Exemples
+
+### Condé
+
+- https://ecoles-conde.com/sitemap_index.xml
+- https://ecoles-conde.com/wp-json/wp/v2/posts
+- https://ecoles-conde.com/wp-json/wp/v2/pages
+
+### IUT Bordeaux Montaigne
+
+- https://www.iut.u-bordeaux-montaigne.fr/wp-sitemap.xml
+- https://www.iut.u-bordeaux-montaigne.fr/wp-sitemap-posts-post-1.xml
+- https://www.iut.u-bordeaux-montaigne.fr/wp-sitemap-posts-page-1.xml
+- https://www.iut.u-bordeaux-montaigne.fr/wp-json/wp/v2/posts
+- https://www.iut.u-bordeaux-montaigne.fr/wp-json/wp/v2/pages
+
+
+## Recherches
+
+https://kinsta.com/fr/blog/api-rest-wordpress/
+https://getshifter.io/
-- 
GitLab