Ca cocotte! Publication Scientifique - le blog qui clarifie les enjeux de la production académique

jeudi 13 décembre 2018

Automatic reviewing tool

Are texts and personal data of researchers already reused by Elsevier to develop commercial AI reviewing products?

[Publication 13.12.2018]

European copyright does not allow Text Mining on scientific articles

For the moment, many subscription journals practice a complete copyright transfer after acceptance of author manuscript by contracts or acceptance of general conditions.

Copyright transfer to publisher in practice means that Text Mining (TM) is only possible where Fair Use exception of copyright applies, such as USA and UK: only for non-commercial purpose. The rest of Europe does not have such disposition: even for researchers working in universities with already paid site licenses for metadata, references and attached abstracts, or full texts of articles, they have to pay licences to perform TM.

Plan S position shows that the current use situation of copyright of scientific articles may not be satisfactory for further research, including TM and Artificial Intelligence (AI) developement. Plan S states that researcher-author of article should retain copyright and apply an CC-BY license, to allow easier re-use of article, as stated in the Berlin Declaration. The copyright reform in EU includes debates on a kind of introduction of Fair Use exception for research purpose. 

PlanS and copyright reform clearly consider TM as a high issue for research. Some persons and groups even think to allow TM for commercial purpose for the benefit of innovation. But to my knowledge, legacy publishers are not supporting introduction of fair use.  

Copyright assignment on researchers non-articles texts

According to copyright laws in any EU country, copyright owns the person who writes any text. As such, researchers-authors retain copyright on e-mails, comments to editors, texts in formulars, and author manuscripts before reviewing (pre-prints) and after reviewing (post-prints), etc. even a submission platform owned by a publisher was used (for exemple Evise owned by Elsevier).

Where Fair Use exists, it means that TM is only allowed for non-commercial purpose, so publishers including Elsevier, may not text mine legally non-articles copyrighted texts by researchers to develop commercial and patented AI reviewing products. 

Highlights statements and manuscripts used for AI research

Article If AI can fix peer review in science, AI can do anything: a 2 years post-doc at UCL university in UK, paid by Elsevier, apparently developed a product based on TM on author manuscripts in the perspective of AI reviewing system.  
“reading each paper and identifying its key concepts, organizing key words by type, and identifying relationships between different key phrases. And it's not just an academic exercise: Mrs Isablle Augenstein is on a two-year contract with Elsevier, one of the world's largest publishers of scientific research, to develop computational tools for their massive library of manuscripts”.

The conference proceedings article A Supervised Approach to Extractive Summarisation of Scientific Papers by Isabelle Augenstein clearly says that non-article researcher-author texts and author article manuscripts were used to perform TM: 
“The dataset is created by exploiting an existing resource, ScienceDirect, where many journals require authors to submit highlight statements along with their manuscripts. Using such highlight statements as gold statements has been proven a good gold standard for news documents”.

My questions

1.Was this really academic research, and therefore Fair Use exception for non-commercial research was considered as relevant?

2.Proceeding article states at end under acknowledgment section: 'This work was partly supported by Elsevier'. -> What about possible conflict of interest that may have been declared in a paragraph Conflict of Interest instead of Acknowledgment?

3.Knowing that all researchers-authors retain copyright on highlight statements and manuscripts and that research may have putative commercial interest, where they all asked a re-use permission?

4.Is Elsevier already performing TM on researcher-authors texts and personal data to develop an AI commercial putative patented reviewing product?

5. What are universities responsibilities to allow or forbid AI research sponsored by publishers for potential patented commercial reviewing products?

6.Can EU researcher-authors ask to erase all e-mails, comments, headlights of research, author manuscripts, personal data etc from Evise platform and Elsevier business, as GDPR allows to?

7.How researcher copyright right may be reinforced? Should Plan S develop a statement about copyrighted material belonging to researchers when they use proprietary commercial publisher submission platform?

8. Is Elsevier already taking for granted that EU will enable TDM for commercial purpose in copyright reform, despite being against introduction of Fair Use exception in copyright reform?

9. Allowing TM for commercial in EU may lead to massive reuse of researchers personal data even as form of non articles personal texts, without their consent, and may infringe competition and data personal protection laws? 

I twitted twice to Elsevier and wrote email to proceeding article principle author to have some more detail on the case so far without any success (13.1.2018). No answer.

I wish your feed backs, comments and correction of the text. Thank you in advance. 

mardi 20 mars 2018

Green Open Access strategy

Liège OA model 

Why should you sign the open letter Pour une science ouverte en Fédération Wallonie-Bruxelles? 
[Publication 20.03.2018]

Green Grass and Blue Sky, CC0
This is a call to Switzerland based (and European) researchers, librarians, archivists, swissuniversities and Swiss National Foundation members to sign the open letter intended for Belgian Parliament


The aim of decree is to extend the institutional Open Access (OA) strategy of Liège University, called also "Liège model", to the federal Belgian level by changing copyright law.

  • The Belgian decree is not about mandatory Green-OA (Open Access), it is about a mandatory deposit for all types of publication into institutional public archives. 
  • The researcher decides then to open full text or not, according to publisher conditions checked for example with Sherpa/Romeo tool.
  • Copyright transfer to publisher remains untouched, and there is no non exclusive licence given to institutions. 
  • Academic freedom is preserved, ie freedom of where, how, when to publish 
  • Favor the practice of Green-OA because it is combined with institutional researcher evaluation practice with the institutional database (ORBI), and supporting DORA declaration by avoiding to rely on WoS and related Impact Factor mainly or only. 
In Germany, a "harder" version of Green-OA was already adopted some years ago. Copyright reform included a secondary right of publication. 

  • Apparently, it may favor Green-OA more efficiently than Liège model. But in reality, the inclusion of a secondary publication right in copyright does not seem sufficient to ensure its application with publishers based abroad.

    The principle of autonomy is provided by the Rome Convention: 
    • "The contract is governed by the law chosen by the parties. This choice must be express or result in a certain manner from the provisions of the contract or circumstances of the case. By that choice, the parties may designate the applicable to all or only part of their contract. " Parties can choose a neutral law" from a country that has no connection with the operation.
    • In the case of signing a contract between a researcher-author in Germany and a publisher based abroad, it is international private law that applies, and the secondary publication right in German law does not prevail necessarily on the country of the publisher that would not. The scope of the right to secondary publication is therefore limited.
  • Moreover, some professors rejected mandatory OA adopted by its institution Konstanz University: 
    • Some professors are concerned about academic freedom violation ie freedom of where, how, when to publish
    • Some law professors consider that institutional mandatory OA might be a violation of the federal law containing the right of secondary publication. An institutional law cannot be higher than a federal law. 

In Switzerland, Professors Florent Thouvenin, Daniel Hürlimann, Bertil Cottier, & Blaise Carron proposed a secondary right of publication:
I see the Liège model as tool to favor OA at low cost at institutional level, that could be adopted easily, and pragmatically by swissuniversities, before the next copyright putative reform in 25 years.

Therefore, signing this Belgian open letter may be the first step to favor OA at reasonable costs in Switzerland. Liège model is not a big and loud revolution, it is quiet, slow, and preserve academic freedom, but it is efficient.

Adoption of Liège model by swissuniversities would have the advantage to preserve fragile innovative new publication alternative players, such as eLife, Scipost, OLH, PloS, ScienceMatters journals, alternative initiative such as FairOpenAccessAlliance , and open publishing softwares and platforms Public Knowledge, 
KnowledgeUnlatched and HOPE.  

In contrary, OA Big Deals "Read & Publish" announced by swissuniversities may reinforce the dominant position of STM legacy publishers Elsevier, Springer, Wiley and Taylor and Francis (Négociations avec les éditeurs internationaux by swissuniversities Press release and Factsheet ) and kill new initiatives; by the way Liège model is totally compatible with OA Big Deals, if you also agree with this swissuniversities OA strategy!

mardi 12 décembre 2017

DMP-Experimentation animale

Data Management Plan

Inclure les données de l'expérimentation animale à des fins de transparence, validité et reproductibilité?!

[Publication 12.12.2017]

Mettez tous vos oeufs dans le même panier, le DMP! Photo Egg textures CC-BY Lobo

Depuis Octobre 2017, le Fond National Suisse (FNS) exige un Data Management Plan (DMP) lors de la soumission de projets. La transparence de l'expérimentation animale de la recherche pré-clinique devrait être maximale pour une meilleure reproductibilité, validité externe, translation et pour l'application des 3Rs (Refine, Reduce, Replace animal experimentation).

C'est pourquoi un DMP en recherche pré-clinique pourrait comporter les données de l'expérimentation animale.

Ce "DMP modèle" présente des éléments clés qui pourraient y être inclus, dans le cas d'une étude pré-clinique basée sur le test d'une hypothèse, appellée aussi étude de confirmation.

Cet embryon de DMP est une sorte de réponse aux documents publiés en 2016-2017, un essai pour participer pratiquement à l'amélioration de la validité de la recherche biomédicale et pré-clinique en Suisse.
J'espère que ce modèle inspirera des chercheurs biomédicaux et leur sera utile pour leurs réflexions! 

English translation below...

jeudi 31 août 2017

Publication de données scientifiques

Dataset : le libre choix de licence au chercheur-auteur !

[Publication 31.08.2017]

Choisissez ce qui convient à votre recherche! (Photo Fruit stall at Barcelona market CC BY-SA Andy Mitchell)
Un dataset, nouveau type de publication de jeu de données scientifiques, est soumis à droit d'auteur. Le choix d'une licence, le datalicensing, est délicat. Il doit tenir compte de l'intégrité scientifique, du droit d'auteur, et du contexte de la recherche. Le choix de datalicensing revient au chercheur-auteur, qui maîtrise le mieux le contexte de sa recherche.

Les hautes-écoles, coordonnées avec swissuniversities, devraient communiquer cette liberté de choix au plus vite, et proposer des marches à suivre dans des commentaires de règlements ou dans des page web institutionnelles.

Cette clarification présenterait des avantages pour le chercheur-auteur. Il pourrait ainsi:

  • éviter de s’arracher les cheveux lors de la rédaction d'une requête au Fond National Suisse (FNS): « qui sera propriétaire des données et quelles licences seront appliquées?» 
  • profiter de pratiques de dataset licensing cohérentes entres hautes écoles; 
  • être motivé à publier des datasets par l'exercice de la liberté de choix de licence.

lundi 15 mai 2017

Droit de republication

Droit de republication

Des textes législatifs pour faciliter le green open access par les chercheurs !

Appel aux professeurs et juristes des universités suisses spécialistes de la propriété intellectuelle

Quel texte de loi modifier pour parvenir à interdire le transfert exclusif du droit d'auteur à l'éditeur? (photo CC0)

[Publication 15.05.2017, mises à jour 25.05 and 26.06 2017]

La stratégie Open Access (OA) publiée par swissuniversities le 31.01.2017 formule: "Pour assurer la durabilité de la transition vers l’OA, le cadre de réglementation devrait être adapté de manière à ne pas seulement autoriser, mais aussi encourager l’OA et la réutilisation. La révision actuelle de la loi suisse sur le droit d’auteur devrait prévoir (...) qu’un droit inconditionnel à une seconde publication soit accordé, comme la communauté scientifique l’a demandé au cours de la consultation".

La question est donc de savoir quels juristes universitaires et professeurs de droit travailleront avec leurs rectorats sur la création de ce nouveau cadre législatif, et comment ils vont s’organiser pour l'adoption d'une position commune nécessaire aux négociations avec les éditeurs dont les lobbies et associations sont puissants et bien organisés ?

Voici réunis en un seul coup d'oeil, des propositions embryonnaires concrètes de positions et de modifications de textes de loi, dont les points forts et faibles pourraient être discutés lors de Swiss IGF le 30.05.2017, pendant le thème "Accès et conditions réglementaires des publications scientifiques – Le droit d’auteur, une barrière ou un pilier?" Ce forum et ce billet pourraient-ils encourager la constitution d’un groupe de travail de professeurs, juristes et responsables d'archives ouvertes pour la réalisation du droit de republication?

jeudi 24 novembre 2016

Open Access et TDM

Redonner le droit d'auteur aux chercheurs par la Loi sur le Droit d'Auteur (LDA) et le Code des Obligations Suisse (COS)!

[Publication 24.11.2016 | Mises à jour 13.04.2017, 23.01.2017]

La loi permettrait aux chercheurs de ne plus transférer exlusivement le droit d'auteur à l'éditeur (photo CC0)

L'Open Access (OA) ne se heurte pas au droit d'auteur parce-que les publications scientifiques sont protégées par celui-ci, mais plutôt en raison de l'exercice de ce droit, dont les éditeurs sont les cessionaires exclusifs. Le droit d'auteur permet de s'approprier une oeuvre et donc d'en interdire l'exploitation par les tiers, mais il pourrait aussi permettre d'organiser le partage d'une publication scientifique si tel était le souhait du titulaire du droit. 

L'enjeu est de donner des moyens au chercheur-auteur scientifique de décider de publier en open access ou non, et de permettre ou non la réutilisation de son article scientifiqueAutrement dit, un dispositif législatif devrait donner aux chercheurs-auteurs le moyen d'exercer réeellement leur liberté, en leur offrant la possibilité de choisir les modes de diffusion et de réutilisation de leurs publications. 

L'autre enjeu est de pouvoir extraire, analyser, et interpréter des informations contenues dans les articles scientifiques publiés; depuis longtemps, il est possible de le faire avec un papier et un crayon, mais à l'ère numérique, l'emploi de machines pour l'analyse automatisée des textes pourrait être une opportunité de recherche nouvelle, que la cession exclusive du droit d'auteur à l'éditeur entrave, et que la pratique de l'OA ne suffit pas à résoudre. L'essai propose d'explorer l'introduction d'un droit à la publication secondaire et à l'introduction d'une exception au droit d'auteur à des fins de Text Data Mining (TDM).

lundi 12 septembre 2016


Transparence des coûts par éditeurs dans les bibliothèques universitaires

"Compte rendu" du Congrès BIS de septembre 2016

Transparence pour la recherche et transparence des coûts des publications (Photo CC0)

[Publication 12.09.2016 | Mises à jour  21.12.2017 ; 25.07, 13.04. et 10.01.2017, 20.12.2016]

Les conversations "off" et balades à la conférence de l’association Bibliothèque Information Suisse (BIS) m’ont permis de constater que le thème «publication des coûts par éditeurs des journaux scientifiques des bibliothèques universitaires » était mal connu ou sous-estimé. Il n’a fait l’objet d’aucun traitement dans les conférences, workshops ou stands liés au thème de l’éthique des bibliothèques suisses, plutôt focalisées sur la problématique (importante) de la protection des données des usagers; il ne ferait aucunement partie des priorités des instances dirigeantes des bibliothèques universitaires et hautes écoles suisses;  il serait seulement un combat solitaire de M. Christian Gutkecht;  la récolte, la centralisation de données comparables, et la publication de données exportables devraient être effectuées par des tiers aux bibliothèques de swissuniversities: la création de cet outil ne relèverait pas de leur mission; et enfin, si intérêt il y avait, alors la publication serait limitée aux coûts dont les contrats ne contiennent aucune clause de confidentialité, le droit commercial primant sur le droit à la transparence. 

Je ne partage pas ces vues et cette désaffection du sujet. Méconnaissance des récents développements de la transparence de la gestion publique en général? Méconnaissance des enjeux ou des percées récentes de la transparence des coûts de la publication scientifique ? Ou simples opinions différentes? En tous cas, il n'est pas dangereux de suggérer quelques lectures, afin de cerner le sujet!