Discussioni Cathopedia:Progetto Diocesi

Da Cathopedia, l'enciclopedia cattolica.
Vai alla navigazione Vai alla ricerca

Ricapitolando

Lo Script di Riccardobot usato nel lontano 2006 per importare le pagine delle diocesi e dei vescovi da http://www.catholic-hierarchy.org non funziona. L'Utente Riccardov, per sua stessa ammissione ha creato uno script non facilmente comprensibile da un altro e pure con degli errori. Abbiamo cercato di contattarlo ma non risponde. Lo script invece non funziona perchè forse da allora la struttura del sito originale è cambiata. Che facciamo? --AP (scrivimi) 08:38, 4 mag 2010 (UTC)

Complimenti per il lavoro. In concreto se volessi aiutare cosa posso fare? Si parla di script originale che dovrebbe essere simile a quello implementato su wiki. Se qualcuno ha la pazienza di spiegarmi come funziona uno script e come lo si possa modificare. Sarei ben contento di dare una mano, purtroppo pardo da 0 o poco più. Comunque sono a disposizione se posso aiutare, complimenti e buon lavoro. Elvezio 08:29, 4 mag 2010 (UTC)

Che facciamo?

Sono finalmente riuscito a far funzionare il vecchio script di Riccardov per importare le pagine di catholic-hierarchy su Cathopedia. ora bisogna decidere cosa fare, o meglio:

Errori

Problema 1: le pagine generate dallo script in questione sono standardizzate e contengono errori (Risultato). Alcuni cercherò di correggerli modificando lo script prima dell'eventuale importazione di massa, altri bisognerà correggerli a mano. --AP (scrivimi) 10:06, 13 mag 2010 (UTC)

Io prenderei la cosa con calma, cercando di limare lo script finché riusciamo a ridurre al minimo gli errori. Don Paolo Benvenuto - scrivimi 12:00, 13 mag 2010 (UTC)

Conteggio voci

Problema 2: le diocesi sono centinaia. "Rischiamo" di veder raddoppiare le dimensioni di Cathopedia in pochi giorni. Ma, visto il problema 1, non mi sembra il caso di riempirla di pagine fatte male. Se e quali diocesi è meglio importare per prime? --AP (scrivimi) 10:06, 13 mag 2010 (UTC)

Immettere automaticamente voci con unicamente dati standard porta ad aumentare il numero di voci di Cathopedia senza che ciò corrisponda a un aumento effettivo del valore aggiunto di Cathopedia.
Io farei un qualcosa di simile a quanto abbiamo con gli anni. IL fatto è che contano per il numero di voci solo quelli che hanno almeno un collegamento interno o una categoria (http://www.mediawiki.org/wiki/Manual:Article_count).
Bisognerebbe che il bot di generazione delle diocesi generasse non le pagine delle diocesi usando dei templates da includere nelle corrispondenti voci. Cioè: invece di creare Diocesi di Timbunctu direttamente, creare Template:Diocesi di Timbunctu/Incipit, Template:Diocesi di Timbunctu/Storia, Template:Diocesi di Timbunctu/Vescovi, ecc., e creare Diocesi di Timbunctu con l'incipit, i titoli di sezione e le varie sezioni incluse:

{{Diocesi di Timbunctu/Incipit}}

== Territorio ==

{{Diocesi di Timbunctu/Territorio}}

== Vescovi ==

{{Diocesi di Timbunctu/Vescovi}}

== Altra sezione ==

{{Diocesi di Timbunctu/Altra sezione}}

ecc.

I template li farei con l'idea di non modificarli a mano (a meno di errori del bot), in maniera che, se compaiono eventuali correzioni o dati aggiuntivi, basterebbe far girare di nuovo un bot per aggiornare i corrispondenti dati. Le categorie poi potrebbero essere messe nell'incipit in maniera che non risultino esplicitamente nelle voci.
In questa maniera generiamo moltissime voci, ma senza neanche un collegamento interno o una categoria, e quindi non ci influenzano il conteggio delle voci. Il sistema permette invece di aggiungere contenuto tra un template e un altro, nelle varie sezioni, dove si vuole. E nel momento in cui gli si aggiunge qualcosa la voce acquista valore aggiunto e viene contata.
Il vantaggio della struttura che ho delineato è che si può aggiungere testo non solo sotto, ma anche immediatamente sopra i templates, e i templates rimarrebbero difficilmente modificabili, perché cliccando sul modifica della sezione si vedrebbe il codice che include il template.
Don Paolo Benvenuto - scrivimi 12:00, 13 mag 2010 (UTC)
Ho provato a fare un tentativo. Cosa ne pensate?
Quindi io potrei ora generare lo "scheletro" delle pagine di tutte le diocesi del mondo senza per questo "drogare" le dimensioni di Cathopedia? In tal caso però avrei bisogno di un elenco delle diocesi del mondo in italiano... --AP (scrivimi) 21:11, 16 mag 2010 (UTC)

Da Wikipedia?

Una seconda via sarebbe importare le pagine delle diocesi direttamente da Wikipedia. Ma anche qui sorge una domanda: è giusto continuare con queste importazioni di massa? Non sarebbe meglio preferire una nostra strada originale? Senza contare che, per fare l'operazione in automatico tramite Bot, dovrei essere (mi pare) nominato amministratore di entrambi i progetti. Ipotesi quindi da scartare.

Ditemi cosa ne pensate. --AP (scrivimi) 10:06, 13 mag 2010 (UTC)

Non importerei da it.wiki. Don Paolo Benvenuto - scrivimi 12:00, 13 mag 2010 (UTC)
Non capisco bene il meccanismo, tenete presente, ma sicuramente ne siete a conoscenza, che un certo numero di diocesi sono già state caricate prendendole da wiki. non so se può aiutare. Il lavoro fatto da Andrea per gli anni è sicuramente positivo e si distingue da wiki, se si ottiene lo stesso risultato con le diocesi sarebbe buona cosa andare in quella direzione. Buon lavoro Elvezio - scrivimi! 15:13, 13 mag 2010 (UTC)
Ahch'io non sono d'accordo con le importazioni da it.wiki (la categoria delle pagine importate ha ormai raggiunto le 2500 voci), se non con moderazione. Io sono d'accordo con la proposta di donPaolo anche se credo non sia una cosa che si fa in 4 e quattr'otto. --AP (scrivimi) 20:49, 14 mag 2010 (UTC)
Credo che, nel complesso, se riesci a importare col bot da catholic hierarchy riducendo al minimo gli errori sarebbe bene. Nell'esempio che riporti mi pare di vedere che gli errori sono limitati al fatto che il bot non riesce a capire che la diocesi deriva da una fusione, e non capisce che è suffraganea di lione. E' complicato modificare il bot e renderlo + intelligente?
Anche con questi errori, però, credo che non sarebbe male se si importano tutte le diocesi col bot. Le voci aumenteranno, ok, ma un collegamento blu che rimanda a una voce perfettibile ma con i link per migliorarla, è sempre meglio di un link rosso. --RR 06:24, 16 mag 2010 (UTC)
Cambiare lo script non dovrebbe essere difficile... io propenderei per il progetto DonPaolo, ovvero una pagina che è una lista di template. --AP (scrivimi) 09:48, 16 mag 2010 (UTC)

Diocesi di Vittorio Veneto

Bene il lavoro fatto!

Dunque, io cambierei:

  1. lasciare una riga vuota dopo i titoli di sezione (per la leggibilità)
  2. le categorie non devono andare in fondo alla voce, ma in un template, io le metteri nell'incipit, altrimenti la voce viene conteggiata
  3. i link per modificare i templates non li metterei, anche perché i template li aggiorniamo unicamente tramite bot: per eventuali errori bisogna riuscire a mettere a posto il bot in maniera che non faccia più l'errore e rifarlo girare sulla pagina che dava errore; chi poi dovesse a tutti i costi modificare i template può sempre andare in modifica della pagine, e gli vengono in fondo i link per modificare i templates
  4. l'uso dei templates va ridotto ai dati importati con il bot; gli altri dati aggiunti a mano si mettono fuori dai templates; non dimenticare che i templates ci servono per evitare di conteggiare tante voci che riportano unicamente dati presi da un db esterno; invece tutto quello che si aggiunge a mano ha valore aggiunto e quindi si mette fuori dai templates
  5. come mai ti sono venuti fuori i links a Chiesa cattolica in Brasile e a Chiesa cattolica in Ciad?
  6. la parola cronotassi (che neanch'io avevo mai sentito) è proprio necessaria? nelle linee generali del progetto c'è la semplicità e comprensibilità, possiamo trovare un'altra parola?

Per le diocesi non ancora presenti il bot deve creare soltanto la struttura dei templates che hanno dei dati, evitando di porre le sezioni a cui non corrispondono dati; anche la sezione delle note non la metterei se il bot non genera note.

Per le diocesi già presenti... cosa facciamo?

  • il bot riesce a integrare la voce con le sezioni dei dati del db?
  • generiamo i templates e andiamo a linkarli a mano nelle voci?

Don Paolo Benvenuto - scrivimi 17:56, 3 giu 2010 (UTC)

Risposte

  1. Davvero? Non vengono troppi spazi?
  2. Le ho messe in incipit. Come puoi vedere, alcune potrebbero essere generate automaticamente dal {{Diocesi della chiesa cattolica}}, se fosse opportunamente modificato. ma questo manderebbe in pallone tutte le pagine che lo contengono. L'ideale sarebbe fare una operazione simile al template {{Persona}}, ovvero creare un nuovo template universale (e automatizzato) che subentri al vecchio template "Diocesi" (e anche al simile template "Diocesi soppressa").
  3. Ok, anche se la vedo dura riuscire a creare un bot che faccia questa operazione senza errori.L'ideale secondo me sarebbe stringere un'epocale accordo di collaborazione con i siti catholic hierarchy e gcatholic, perché un conto è convertire pagine web in pagine wiki (e poi controllarle per tenerle aggiornate); molto più facile sarebbe convertire database anche grossi in pagine wiki, e sicuramente i gestori di quei due siti li hanno, altrimenti non riuscirebbero ad avere sempre tutto sincronizzato (e, nel caso di gcatholic, anche ad aggiornare la pagina di twitter correlata in tempo reale). Cosa possiamo dare in cambio a loro, oltre che un link assicurato tra i collegamenti esterni in ogni pagina, non lo so.
  4. Ok, vedo di fare le modifiche necessarie.
  5. i link Brasile+Ciad li ho messi perché la diocesi ha due missioni fidei donum in quei paesi. Se questo giustifica la presenza o meno delle due categorie, bisogna deciderlo come linea guida.
  6. La parola cronotassi l'ho trovata su WP-it ma nessuno ci vieta di cambiarla.

Per quanto riguarda le diocesi già presenti mi sa che bisognerà modificarle a mano, ma quello è il secondo passo. --AP (scrivimi) 20:50, 3 giu 2010 (UTC)

Ho scritto a David M. Cheney e gli ho chiesto se ci può passare i dati in formato sql o simile. Don Paolo Benvenuto - scrivimi 21:48, 3 giu 2010 (UTC)