Skip to content
Snippets Groups Projects
Commit 1395992b authored by Arnaud Levy's avatar Arnaud Levy
Browse files

clean

parent f5cb80f8
No related branches found
No related tags found
No related merge requests found
......@@ -19,7 +19,11 @@ class Wordpress
fragment.css("h#{i}").each { |element| element.name = "h#{i+1}" }
end
end
fragment.to_html(preserve_newline: true)
html = fragment.to_html(preserve_newline: true)
# LSEP is invisible!
html = html.delete("
", "
", "
")
html = html.gsub /\u2028/, ''
html
end
def initialize(domain)
......
# one:
# record: name_of_fixture (ClassOfFixture)
# name: content
# body: <p>In a <i>million</i> stars!</p>
# == Schema Information
#
# Table name: communication_website_imported_media
#
# id :uuid not null, primary key
# data :jsonb
# file_url :text
# filename :string
# identifier :string
# mime_type :string
# created_at :datetime
# updated_at :datetime
# medium_id :uuid
# university_id :uuid not null
# website_id :uuid not null
#
# Indexes
#
# index_communication_website_imported_media_on_medium_id (medium_id)
# index_communication_website_imported_media_on_university_id (university_id)
# index_communication_website_imported_media_on_website_id (website_id)
#
# Foreign Keys
#
# fk_rails_... (medium_id => communication_website_media.id)
# fk_rails_... (university_id => universities.id)
# fk_rails_... (website_id => communication_website_imported_websites.id)
#
one:
university: one
identifier: MyString
website: one
data:
remote_created_at: 2021-10-19 11:18:47
remote_updated_at: 2021-10-19 11:18:47
file_url: MyText
two:
university: two
identifier: MyString
website: two
data:
remote_created_at: 2021-10-19 11:18:47
remote_updated_at: 2021-10-19 11:18:47
file_url: MyText
# == Schema Information
#
# Table name: communication_website_media
#
# id :uuid not null, primary key
# file_url :text
# filename :string
# identifier :string
# mime_type :string
# created_at :datetime not null
# updated_at :datetime not null
# university_id :uuid not null
# website_id :uuid not null
#
# Indexes
#
# index_communication_website_media_on_university_id (university_id)
# index_communication_website_media_on_website_id (website_id)
#
# Foreign Keys
#
# fk_rails_... (university_id => universities.id)
# fk_rails_... (website_id => communication_websites.id)
#
one:
university: one
website: one
two:
university: two
website: two
......@@ -2,49 +2,56 @@ require "test_helper"
class WordpressTest < ActiveSupport::TestCase
test "convert apostroph" do
assert_equal Wordpress.clean('Ouverture du CRM pendant les vacances d&#8217;Avril'),
'Ouverture du CRM pendant les vacances dAvril'
assert_equal 'Ouverture du CRM pendant les vacances dAvril',
Wordpress.clean('Ouverture du CRM pendant les vacances d&#8217;Avril')
end
test "convert 3 dots" do
assert_equal Wordpress.clean('Le CRM fait le tri dans ses collections &#8230; et vous propose une vente de livres'),
'Le CRM fait le tri dans ses collections et vous propose une vente de livres'
assert_equal 'Le CRM fait le tri dans ses collections et vous propose une vente de livres',
Wordpress.clean('Le CRM fait le tri dans ses collections &#8230; et vous propose une vente de livres')
end
test "convert double quotation marks" do
assert_equal Wordpress.clean('Conférence Joëlle Zask : &#8220;Ecologie de la participation&#8221;'),
'Conférence Joëlle Zask : Ecologie de la participation”'
assert_equal 'Conférence Joëlle Zask : Ecologie de la participation”',
Wordpress.clean('Conférence Joëlle Zask : &#8220;Ecologie de la participation&#8221;')
end
test "convert h1" do
assert_equal Wordpress.clean('<h1>B.U.T. Métiers du multimédia et de l&#8217;internet</h1>'),
'<h2>B.U.T. Métiers du multimédia et de linternet</h2>'
assert_equal '<h2>B.U.T. Métiers du multimédia et de linternet</h2>',
Wordpress.clean('<h1>B.U.T. Métiers du multimédia et de l&#8217;internet</h1>')
end
test "convert h2 without h1" do
assert_equal Wordpress.clean('<h2>B.U.T. Métiers du multimédia et de l&#8217;internet</h2>'),
'<h2>B.U.T. Métiers du multimédia et de linternet</h2>'
assert_equal '<h2>B.U.T. Métiers du multimédia et de linternet</h2>',
Wordpress.clean('<h2>B.U.T. Métiers du multimédia et de l&#8217;internet</h2>')
end
test "convert h2 with h1" do
assert_equal Wordpress.clean('<h1>Bachelor Universitaire de Technologie</h1><h2>B.U.T. Métiers du multimédia et de l&#8217;internet</h2>'),
'<h2>Bachelor Universitaire de Technologie</h2><h3>B.U.T. Métiers du multimédia et de linternet</h3>'
assert_equal '<h2>Bachelor Universitaire de Technologie</h2><h3>B.U.T. Métiers du multimédia et de linternet</h3>',
Wordpress.clean('<h1>Bachelor Universitaire de Technologie</h1><h2>B.U.T. Métiers du multimédia et de l&#8217;internet</h2>')
end
test "convert " do
assert_equal Wordpress.clean('TRAVAILLER DEMAIN, Débat &#8211; le 10 mai à 18h30'),
'TRAVAILLER DEMAIN, Débat le 10 mai à 18h30'
assert_equal 'TRAVAILLER DEMAIN, Débat le 10 mai à 18h30',
Wordpress.clean('TRAVAILLER DEMAIN, Débat &#8211; le 10 mai à 18h30')
end
test "remove classes" do
assert_equal Wordpress.clean('<h2 class="titre-diplome">→ Qu’est-ce que le B.U.T.&nbsp;?</h2>'),
'<h2>→ Qu’est-ce que le B.U.T.&nbsp;?</h2>'
assert_equal '<h2>→ Qu’est-ce que le B.U.T.&nbsp;?</h2>',
Wordpress.clean('<h2 class="titre-diplome">→ Qu’est-ce que le B.U.T.&nbsp;?</h2>')
end
test "remove line_separators (LSEP)" do
# Invisible char before A, and html code
assert_equal "Au ",
Wordpress.clean("
Au &#8232;")
end
test "remove divs" do
# Quid des images ? Comment gérer le transfert vers scaleway + active storage dans le code ?
assert_equal Wordpress.clean('<div class="wp-block-group"><div class="wp-block-group__inner-container"><div class="wp-block-columns"><div class="wp-block-column"><div class="wp-block-image"><figure class="alignright size-medium is-resized"><a href="https://www.iut.u-bordeaux-montaigne.fr/wp-content/uploads/2021/01/visuel_1.png" rel="lightbox[14475]"><img src="https://www.iut.u-bordeaux-montaigne.fr/wp-content/uploads/2021/01/visuel_1-240x300.png" alt="Le BUT, qu\'est-ce que c\'est ?" class="wp-image-14821" width="173" height="216" srcset="https://www.iut.u-bordeaux-montaigne.fr/wp-content/uploads/2021/01/visuel_1-240x300.png 240w, https://www.iut.u-bordeaux-montaigne.fr/wp-content/uploads/2021/01/visuel_1.png 730w"></a></figure></div></div>'),
'<figure><a href="https://www.iut.u-bordeaux-montaigne.fr/wp-content/uploads/2021/01/visuel_1.png"><img src="https://www.iut.u-bordeaux-montaigne.fr/wp-content/uploads/2021/01/visuel_1-240x300.png" alt="Le BUT, qu\'est-ce que c\'est ?" width="173" height="216" srcset="https://www.iut.u-bordeaux-montaigne.fr/wp-content/uploads/2021/01/visuel_1-240x300.png 240w, https://www.iut.u-bordeaux-montaigne.fr/wp-content/uploads/2021/01/visuel_1.png 730w"></a></figure>'
assert_equal '<figure><a href="https://www.iut.u-bordeaux-montaigne.fr/wp-content/uploads/2021/01/visuel_1.png"><img src="https://www.iut.u-bordeaux-montaigne.fr/wp-content/uploads/2021/01/visuel_1-240x300.png" alt="Le BUT, qu\'est-ce que c\'est ?" width="173" height="216" srcset="https://www.iut.u-bordeaux-montaigne.fr/wp-content/uploads/2021/01/visuel_1-240x300.png 240w, https://www.iut.u-bordeaux-montaigne.fr/wp-content/uploads/2021/01/visuel_1.png 730w"></a></figure>',
Wordpress.clean('<div class="wp-block-group"><div class="wp-block-group__inner-container"><div class="wp-block-columns"><div class="wp-block-column"><div class="wp-block-image"><figure class="alignright size-medium is-resized"><a href="https://www.iut.u-bordeaux-montaigne.fr/wp-content/uploads/2021/01/visuel_1.png" rel="lightbox[14475]"><img src="https://www.iut.u-bordeaux-montaigne.fr/wp-content/uploads/2021/01/visuel_1-240x300.png" alt="Le BUT, qu\'est-ce que c\'est ?" class="wp-image-14821" width="173" height="216" srcset="https://www.iut.u-bordeaux-montaigne.fr/wp-content/uploads/2021/01/visuel_1-240x300.png 240w, https://www.iut.u-bordeaux-montaigne.fr/wp-content/uploads/2021/01/visuel_1.png 730w"></a></figure></div></div>')
end
......
0% Loading or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment