學術不端文獻論文查重檢測系統 多語種 圖文 高校 期刊 職稱 查重 抄襲檢測系統
中國知網學術不端文獻檢測系統,支持本、碩、博各專業學位論文學術不端行為檢測 ! 支持“中國知網”驗證真偽!"期刊職稱AMLC/SMLC、本科PMLC、知網VIP5.3/TMLC2等軟件。
關鍵詞:網絡檢索重萬方學位論文全文數中國知網(CNKI,以下知網)、北京萬方數據株式會社(以下簡稱萬方)是中國國內最具影響力的中文學位論文的提供者,其中“中國優秀碩士學位論文全文數據庫””和“中國博士學位論文全文數據庫”,萬方出版有“中國學位論文全文數據庫”。隨著國內作者的著作權保護意識的提高,雙方為了獲得更多的市場份額,在兩個數據庫業者的數據源、著作權保護、產品宣傳等方面的競爭越來越激烈。但是,萬方在學位論文數據庫中大量包含了不提供全文的論文的標題錄信息。與提供全文的論文同時出現,沒有明確區分其數量。另外,兩個數據庫業者的學位論文數量都在百萬以上,無法通過手動檢索進行統計。、詳細全文收錄數據。因此筆者認為,需要詳細統計收錄的學位授予單位數、重復量等指標和年度變化情況,分析所收錄的學位授予單位的收錄穩定性,向學術機構購買學位論文數據庫提供考試數據。1.1數據獲取時間2011年1月17日~2011年1月19日。因此,關于論文學位數的數字到2011年1月19日為止。
.數據獲取方式是在授權使用范圍內登錄萬方服務站平臺,選擇“學位論文”子庫。檢索記錄了10552977條。其中,博士論文378條、博士論文106530條、碩士論文943269條知識網服務平臺注冊ki.net進入“中國優秀碩士論文全文數據庫新版”和“中國博士學位論文全文數據庫新版”,不輸入檢索詞檢索所有記錄,博士論文145153條,碩士論文11592條。
使用正則表達式提取中文標題、作者姓名、學位授予單位、學位授予年度等4個字段信息。1.3檢索結果的整理是利用桌面數據庫軟件Access整理得到的數據,在年度以學位授予單位分組后,由于手動記錄不合格或必要的字段缺失、學位授予單位不是大陸單位等原因造成的無法使用用的記錄。作者姓名為周金應中國地質大學(北京)碩士論文《長慶西峰油田合單元復合儲藏層建模研究》,萬方數據庫中“學位年度”的記錄值為“1”,論文《基于概念類似度計算的主體映射算法的研究》,作者陳堯,知網絡上學位授予單位記載為“源映射實體名”。|<目標映射實體名稱>等。除萬方博士論文1條、博士論文18條、碩士論文33條外,最終取得博士論文377條、博士論文106512條、碩士論文943336條。除了知網博士論文11條、碩士論文13條外,最后獲得了博士論文145142條、碩士論文11579條。統一了著作錄不規范的名稱。和機械科學研究院、機械科學研究總院一樣,與機械科學研究總院統一。對有多個名稱的單位變更了名稱。例如,軍醫研修學院、解放軍總醫院統稱為中國人民解放軍總醫院。一部分附屬機構、二級學院由上級機關辦理,例如中國科學院的多個研究所,與中國科學院統一認定,兩地的學校設立、兩地的學位授予校也統一認定為同一所學校,像中國石油大學。
在與“985工程”[1]、“211工程”[2]大學數據及大學合并、改名等政策條件相關聯而變更的情況下,兩個數據庫的影響方向一致且增量相同,因此不參與數據整理、比較。2.1在數據庫中收錄“211項目”的大學和大學的情況,1
2.1.1收錄了“211工程”的大學數量。這種類型的大學年收錄數的變化如圖1~2所示。
將收錄的“211項目”的大學和大學進行了比較,發現網絡和萬方中存在著始終沒有收錄全文的高中。其中,網絡上收錄的博士論文單位中缺少寧夏大學、青海大學、西藏大學等西部“211工程”學院。碩士論文的學分中沒有中國藥科大學。萬方所收錄的博士論文單位中缺少的東西很多,北京科技大學、北京理工大學、北京林業大學、北京外國語大學、福州大學、哈爾濱工業大學、海南大學、華東理工大學、以及南大學、南京農業大學、青海大學、清華大學、上海財經大學、包括電氣、西安交通大學等。西北農林科技大學、西藏大學、云南大學、中國媒體大學、中國藥科大學、中央民族大學、中央音樂學院等22所高校。大學有福州大學、哈爾濱工業大學、華東理工大學、南京大學、南京農業大學、上海財經大學、上海外國國語大學、西安交通大學、西北農林科技大學、云南大學、中國藥科大學、中央音樂學院等12所學院。2.1.2收錄“211工程”學院論文數量。根據表1,
與收錄了“211工程”學院學位論文全文實際數量的學院數的變化傾向幾乎一致。但是,從2004年到2006年,萬方和知網所收錄的博、碩士論文數量基本持平,超過了知網數量。通過詳細的比較,筆者發現數據庫運營商在某個單位的論文收錄上存在缺陷。2005年的學位年度,知網收錄了大連理工大學的博士論文是103篇,萬方收錄了271篇。另一個原因是同一篇論文“學位授予年度”欄目的制作內容不同。
以大連理工大學的論文《基于企業價值的財務戰略管理研究》為例,知網的學位授予年度為2005年,在知網的全文封面上標注了“論文的完成時期”為“2004年12月”。大連理工大學圖書館的“本校大學院學位論文”數據庫的答辯日是“2005.4.19”。這種著作的分歧普遍存在。以
篇博士論文為例,知網收錄了“211工程”的大學和學位授予年度是2005年的11230篇博士論文中,與萬方博士論文重復的是7238條,這些重復的論文中,萬方數據庫記載了2002年的3條,2003年的有17條中記載了2004年的459條。年或2007年。嚴格限制網絡和萬方中的“學位年度”是在2005年,重復的論文只有754篇。因此,為了減少這種錯誤所造成的影響,表1中統計的重復數與論文的標題相同,除了作為判斷作者名字是否相同的必要條件之外,也可以僅參照知識網中記載的年份進行比較。篇是和知網重復收錄的20篇現象。
還可以根據記錄方式,重復的數字比實際重復的數字小一些。正如對水的化學式“H2O”的著作一樣,知網上記載著“H”。2O”,在萬方中記載為“H<,2>O”,但是在這種情況下,如果Access中對SQL語句進行比較限定的話,系統會被視為不同的字符串,因此會被判定為不是重復論文。39所“985工程”的大學全部包含在“211工程”的學院里,所以數據庫的學位論文庫所收錄的學校和論文數量中出現的規則與收錄“211工程”的大學相似。
.數據庫里收錄了大學以外的學分。指擁有中國科學院、中共中央黨校、煤炭科學研究總院等研究生學位授予權的企業和事業單位。這些部門不參加高考,但是有很好的研究環境。每年可以培養一定數量的博士、碩士課程的研究生。研究領域有特色,研究成果也同樣有很高的學術價值。合計2000年以后的非高中單位的收錄數,如圖3~4所示。
的數量差很大。從11年度的總和來看,知識網中收錄的博士的全文數幾乎是萬方博士全文數的3倍,碩士的數量也超過了2倍。以具體單位為例