نسخه متنی مقاله

روشی نوين برای دسته‏بندی هوشمند متون علمی

اطلاعات مقاله:
نویسندگان:
 • بابک  تيمورپور

 • محمد مهدی  سپهری

  -
 • ليلا پزشک

اطلاعات تماس:
 • بابک  تيمورپور

  Affiliation:
  آدرس محل کار:
  تلفن محل کار:
  فکس:
  پست الکترونیک:
 • محمد مهدی  سپهری

  Affiliation: -
  آدرس محل کار:
  تلفن محل کار:
  فکس:
  پست الکترونیک:
 • ليلا پزشک

  Affiliation:
  آدرس محل کار:
  تلفن محل کار:
  فکس:
  پست الکترونیک:
متن:

چکيده مقالات نمايه شده در مؤسسه اطلاعات علمي1 (ISI) يکی از معتبرترين شاخص های سنجش علم و فناوری می باشد که طبقه بندی موضوعی آن ها يکی از چالش های بزرگ مديريت فناوری است. در اين مقاله سعی شده است با استفاده از يک روش نوين متن‌کاوي2 به نام SUTC، مقالات متخصصان ايرانی در حوزه فناوری نانو که در مجلات ISI نمايه شده اند دسته‌بندی شوند. اين دسته بندی می تواند معياری مناسب برای سياست گذاران در شناخت توانمندی های کشور در زمينه های مختلف تحقيقاتی فناوری نانو قرار گيرد. در اين راستا، ابتدا استانداردهای معتبر در فناوری نانو با يکديگر ادغام شده و طبقه بندی جامعی برای نانومواد حاصل گرديده است. سپس، با استفاده از روش‌های بازيابی ‌اطلاعات3 و متن‌کاوی، مقالات بدون دانش پيشين از برچسب دسته ها به طور هوشمند دسته‌بندی شده‌اند. به منظور ارزيابی روش طراحی شده، دسته‌بندی هوشمند مقالات با دسته‌بندی مقالات به وسيله خبرگان حوزه نانو مقايسه شده است. نتايج، حاکی از صحت مناسب روش ارائه شده است. کليدواژه ها: علم‏سنجی، فناوری نانو، متن‏کاوی، طبقه‏بندی متون، خوشه‏بندی، معيار سيلوئت

A New Method for Intelligent Categorization of Scientific Texts (Case of Iran’s Nanotechnology Papers) AWT-SEP روشی نوين برای دسته‏بندی هوشمند متون علمی AWT-SEP Abstract: The ISI (Institute for Scientific Information) index is one of the most valuable and frequently used indicators for assessing indexed papers in science and technology journals. Categorization of these papers is a big challenge in management of technology. This paper introduces a new text categorization method - Silhouette based Unsupervised Text Categorization (SUTC). This method has been used for classifying Iranian nanotechnology papers indexed in ISI. First, a few standards are combined to make a comprehensive hierarchy of nanomaterials. Then, by applying information retrieval and text mining methods, papers are categorized intelligently without prior knowledge of class labels. The method is validated by comparing acquired class labels to the selected papers labeled by experts. Our analysis shows acceptable accuracy. Keywords: Scientometrics, Nanotechnology, Text mining, Text categorization, Clustering, Silhouette Coefficient AWT-SEP چکيده مقالات نمايه شده در مؤسسه اطلاعات علمي1 (ISI) يکی از معتبرترين شاخص های سنجش علم و فناوری می باشد که طبقه بندی موضوعی آن ها يکی از چالش های بزرگ مديريت فناوری است. در اين مقاله سعی شده است با استفاده از يک روش نوين متن‌کاوي2 به نام SUTC، مقالات متخصصان ايرانی در حوزه فناوری نانو که در مجلات ISI نمايه شده اند دسته‌بندی شوند. اين دسته بندی می تواند معياری مناسب برای سياست گذاران در شناخت توانمندی های کشور در زمينه های مختلف تحقيقاتی فناوری نانو قرار گيرد. در اين راستا، ابتدا استانداردهای معتبر در فناوری نانو با يکديگر ادغام شده و طبقه بندی جامعی برای نانومواد حاصل گرديده است. سپس، با استفاده از روش‌های بازيابی ‌اطلاعات3 و متن‌کاوی، مقالات بدون دانش پيشين از برچسب دسته ها به طور هوشمند دسته‌بندی شده‌اند. به منظور ارزيابی روش طراحی شده، دسته‌بندی هوشمند مقالات با دسته‌بندی مقالات به وسيله خبرگان حوزه نانو مقايسه شده است. نتايج، حاکی از صحت مناسب روش ارائه شده است. کليدواژه ها: علم‏سنجی، فناوری نانو، متن‏کاوی، طبقه‏بندی متون، خوشه‏بندی، معيار سيلوئت AWT-SEP محمد محمدمهدی سپهری بابک تيمورپور ليلا پزشک AWT-SEP $A New Method for Intelligent Categorization of Scientific Texts (Case of Iran’s Nanotechnology Papers) AWT-SEP روشی نوين برای دسته‏بندی هوشمند متون علمی AWT-SEP Abstract: The ISI (Institute for Scientific Information) index is one of the most valuable and frequently used indicators for assessing indexed papers in science and technology journals. Categorization of these papers is a big challenge in management of technology. This paper introduces a new text categorization method - Silhouette based Unsupervised Text Categorization (SUTC). This method has been used for classifying Iranian nanotechnology papers indexed in ISI. First, a few standards are combined to make a comprehensive hierarchy of nanomaterials. Then, by applying information retrieval and text mining methods, papers are categorized intelligently without prior knowledge of class labels. The method is validated by comparing acquired class labels to the selected papers labeled by experts. Our analysis shows acceptable accuracy. Keywords: Scientometrics, Nanotechnology, Text mining, Text categorization, Clustering, Silhouette Coefficient AWT-SEP چکيده مقالات نمايه شده در مؤسسه اطلاعات علمي1 (ISI) يکی از معتبرترين شاخص های سنجش علم و فناوری می باشد که طبقه بندی موضوعی آن ها يکی از چالش های بزرگ مديريت فناوری است. در اين مقاله سعی شده است با استفاده از يک روش نوين متن‌کاوي2 به نام SUTC، مقالات متخصصان ايرانی در حوزه فناوری نانو که در مجلات ISI نمايه شده اند دسته‌بندی شوند. اين دسته بندی می تواند معياری مناسب برای سياست گذاران در شناخت توانمندی های کشور در زمينه های مختلف تحقيقاتی فناوری نانو قرار گيرد. در اين راستا، ابتدا استانداردهای معتبر در فناوری نانو با يکديگر ادغام شده و طبقه بندی جامعی برای نانومواد حاصل گرديده است. سپس، با استفاده از روش‌های بازيابی ‌اطلاعات3 و متن‌کاوی، مقالات بدون دانش پيشين از برچسب دسته ها به طور هوشمند دسته‌بندی شده‌اند. به منظور ارزيابی روش طراحی شده، دسته‌بندی هوشمند مقالات با دسته‌بندی مقالات به وسيله خبرگان حوزه نانو مقايسه شده است. نتايج، حاکی از صحت مناسب روش ارائه شده است. کليدواژه ها: علم‏سنجی، فناوری نانو، متن‏کاوی، طبقه‏بندی متون، خوشه‏بندی، معيار سيلوئت AWT-SEP محمد محمدمهدی سپهری بابک تيمورپور ليلا پزشک AWT-SEP A New Method for Intelligent Categorization of Scientific Texts (Case of Iran’s Nanotechnology Papers) AWT-SEP روشی نوين برای دسته‏بندی هوشمند متون علمی AWT-SEP Abstract: The ISI (Institute for Scientific Information) index is one of the most valuable and frequently used indicators for assessing indexed papers in science and technology journals. Categorization of these papers is a big challenge in management of technology. This paper introduces a new text categorization method - Silhouette based Unsupervised Text Categorization (SUTC). This method has been used for classifying Iranian nanotechnology papers indexed in ISI. First, a few standards are combined to make a comprehensive hierarchy of nanomaterials. Then, by applying information retrieval and text mining methods, papers are categorized intelligently without prior knowledge of class labels. The method is validated by comparing acquired class labels to the selected papers labeled by experts. Our analysis shows acceptable accuracy. Keywords: Scientometrics, Nanotechnology, Text mining, Text categorization, Clustering, Silhouette Coefficient AWT-SEP چکيده مقالات نمايه شده در مؤسسه اطلاعات علمي1 (ISI) يکی از معتبرترين شاخص های سنجش علم و فناوری می باشد که طبقه بندی موضوعی آن ها يکی از چالش های بزرگ مديريت فناوری است. در اين مقاله سعی شده است با استفاده از يک روش نوين متن‌کاوي2 به نام SUTC، مقالات متخصصان ايرانی در حوزه فناوری نانو که در مجلات ISI نمايه شده اند دسته‌بندی شوند. اين دسته بندی می تواند معياری مناسب برای سياست گذاران در شناخت توانمندی های کشور در زمينه های مختلف تحقيقاتی فناوری نانو قرار گيرد. در اين راستا، ابتدا استانداردهای معتبر در فناوری نانو با يکديگر ادغام شده و طبقه بندی جامعی برای نانومواد حاصل گرديده است. سپس، با استفاده از روش‌های بازيابی ‌اطلاعات3 و متن‌کاوی، مقالات بدون دانش پيشين از برچسب دسته ها به طور هوشمند دسته‌بندی شده‌اند. به منظور ارزيابی روش طراحی شده، دسته‌بندی هوشمند مقالات با دسته‌بندی مقالات به وسيله خبرگان حوزه نانو مقايسه شده است. نتايج، حاکی از صحت مناسب روش ارائه شده است. کليدواژه ها: علم‏سنجی، فناوری نانو، متن‏کاوی، طبقه‏بندی متون، خوشه‏بندی، معيار سيلوئت AWT-SEP Scientometrics, Nanotechnology, Text mining, Text categorization, Clustering, Silhouette Coefficient AWT-SEP علم‏سنجی، فناوری نانو، متن‏کاوی، طبقه‏بندی متون، خوشه‏بندی، معيار سيلوئت AWT-SEP A New Method for Intelligent Categorization of Scientific Texts (Case of Iran’s Nanotechnology Papers) AWT-SEP روشی نوين برای دسته‏بندی هوشمند متون علمی AWT-SEP Abstract: The ISI (Institute for Scientific Information) index is one of the most valuable and frequently used indicators for assessing indexed papers in science and technology journals. Categorization of these papers is a big challenge in management of technology. This paper introduces a new text categorization method - Silhouette based Unsupervised Text Categorization (SUTC). This method has been used for classifying Iranian nanotechnology papers indexed in ISI. First, a few standards are combined to make a comprehensive hierarchy of nanomaterials. Then, by applying information retrieval and text mining methods, papers are categorized intelligently without prior knowledge of class labels. The method is validated by comparing acquired class labels to the selected papers labeled by experts. Our analysis shows acceptable accuracy. Keywords: Scientometrics, Nanotechnology, Text mining, Text categorization, Clustering, Silhouette Coefficient AWT-SEP چکيده مقالات نمايه شده در مؤسسه اطلاعات علمي1 (ISI) يکی از معتبرترين شاخص های سنجش علم و فناوری می باشد که طبقه بندی موضوعی آن ها يکی از چالش های بزرگ مديريت فناوری است. در اين مقاله سعی شده است با استفاده از يک روش نوين متن‌کاوي2 به نام SUTC، مقالات متخصصان ايرانی در حوزه فناوری نانو که در مجلات ISI نمايه شده اند دسته‌بندی شوند. اين دسته بندی می تواند معياری مناسب برای سياست گذاران در شناخت توانمندی های کشور در زمينه های مختلف تحقيقاتی فناوری نانو قرار گيرد. در اين راستا، ابتدا استانداردهای معتبر در فناوری نانو با يکديگر ادغام شده و طبقه بندی جامعی برای نانومواد حاصل گرديده است. سپس، با استفاده از روش‌های بازيابی ‌اطلاعات3 و متن‌کاوی، مقالات بدون دانش پيشين از برچسب دسته ها به طور هوشمند دسته‌بندی شده‌اند. به منظور ارزيابی روش طراحی شده، دسته‌بندی هوشمند مقالات با دسته‌بندی مقالات به وسيله خبرگان حوزه نانو مقايسه شده است. نتايج، حاکی از صحت مناسب روش ارائه شده است. کليدواژه ها: علم‏سنجی، فناوری نانو، متن‏کاوی، طبقه‏بندی متون، خوشه‏بندی، معيار سيلوئت AWT-SEP Scientometrics, Nanotechnology, Text mining, Text categorization, Clustering, Silhouette Coefficient AWT-SEP علم‏سنجی، فناوری نانو، متن‏کاوی، طبقه‏بندی متون، خوشه‏بندی، معيار سيلوئت AWT-SEP

رفرانس :
 1. قاضی نوری، س.س.، حیدری، ا.، 1387، «بیمها و امیدها درباره آثار اجتماعی فناوری نانو (با نگاهی به ایران)»؛ مرکز تحقیقات سیاست­های علمی کشور، تهران.
 2. Kostoff, R., Murday, J., Lau, C., Tolles, W., 2006, "The seminal literature of nanotechnology research", J Nanopart Res; Vol. 8, No. 2, pp. 193–213, Doi: 10.1007/s11051-005-9034-9
 3. Schummer, J., 2004, "Multidisciplinarity, interdisciplinarity, and patterns of research collaboration in nanoscience and nanotechnology", Scientometrics, Vol. 59, No. 3, pp. 425–465, Doi: 10.1023/B:SCIE. 0000018542.71314.38.
 4. Mansuri, R., 2005, "Iran's science and technology policies and indicators", Presented at Seminar on UK & Iran Collaboration in Higher Education and Research: Achivements and Challenges; Tehran.
 5. Nature, Editorial, 2005, Iran's long march, pp: 435,247-248.
 6. پایگاه اینترنتی ستاد ویژه توسعه فناوری نانو (www.nano.ir).
 7. حبیب نژاد کورایم، م.، 1386، «نانو مواد: تعاریف، روش­های تولید، خواص و کاربردها»؛ انتشارات عقیق، تهران.
 8. سند راهبرد 10 ساله آینده توسعه فناوری نانو در جمهوری اسلامی ایران، ستاد ویژه توسعه فناوری نانو، تهران، 1385.
 9.  Janssens, F., Glanzel, W., De Moor, B., 2008, "A hybrid mapping of information science", Scientometrics, Vol. 75, No. 3, pp: 607-631.
 10. Glenisson, P., Glanzel, W., Janssens, F., De Moor, B., 2005, "Combining full-text and bibliometric information in mapping scientific disciplines", Information Processing and Management, Special Issue on Informetrics, Vol. 41, No. 6, pp: 1548-1572.
 11. Fayyad, U., Piatetsky-Shapiro, G., Smyth, P., Uthurusamy, R., 1996, "Advances in Knowledge Discovery and Data Mining", MIT Press.
 12. Dörre, J., Gerstl, P., Seiffert, R., 1999, "Text Mining: Finding Nuggets in Mountains of Textual Data", KDD-99.
 13. Ghazinoory,S., Heydari, E., 2008, "Potential impacts of nanotechnology development in Iran", Technology and Society Magazine, Vol. 27, No. 4, pp: 37, 44.
 14. Sarkar, S., Beitollahi, A., 2009, "An overview on nanotechnology activities in Iran”, Iranian J Publ Health, Vol. 38, No. 1, pp: 65-68.
 15. Gharailou, D., Maghrebi, M., Abbasi, A., 2006, "Comprehensive evaluation of nanotechnology related ISI journals", First International Congress on Nanoscience and Nanotechnology, Faculty of Engineering, University of Tehran, 18th to 20th, December.
 16. Sepehri, M.M., Jahanshahi, M., Yeganeh Fallah, A., 2006, "Identification of emerging trends in Nano-Bio-Technology: A Text Mining Approach", First International Congress on Nanoscience and Nanotechnology, Faculty of Engineering , University of Tehran, 18th to 20th, December.
 17. یگانه فلاح، آ.، 1386، «شناسايي روند نوظهور در دانش نانوبيوتکنولوژي»؛ پایاننامه کارشناسی ارشد مهندسی سیستمهای اقتصادی-اجتماعی، دانشگاه تربیت مدرس، دانشکده فنی و مهندسی، تهران.
 18. محمدی، ا.، 1387، «ترسیم نقشه علمی نانو فناوری در ایران»؛ پایاننامه کارشناسی ارشد علوم کتابداری و اطلاعرسانی، دانشگاه آزاد اسلامی، واحد علوم و تحقیقات، دانشکده علوم انسانی، تهران.
 19. محمدی، ا.، 1388، «حوزه­های تشکیل دهنده فناوری و علم نانو در ایران»؛ پنجمین همایش دانشجویی فناوری نانو، 9-11 خردادماه، دانشکده فناوری­های نوین، دانشگاه علوم پزشکی تهران، تهران.
 20. طهماسبی، ن.، سپهری، م.م. و تیمورپور، ب.، 1386، «مصورسازی پویای نشت اطلاعات بین حوزه­های علمی به­وسیله پیوندكاوی»؛ کنفرانس دادهکاوی ایران، IDMC’07، 29-30 آباتماه، دانشگاه صنعتي اميركبير، تهران.
 21. طهماسبی، ن.، «مصورسازی پویای نشت اطلاعات بین حوزه­های علمی به­وسیله پیوندكاوی»؛ پایاننامه کارشناسی ارشد مهندسی فناوری اطلاعات، دانشکده فنی و مهندسی، دانشگاه تربیت مدرس ، تهران.
 22. Huang, Z., Chen, HC., Chen, ZK., Roco, MC., 2003, "International Nanotechnology Development in: country, institution, and technology field analysis based on USPTO patent database", J Nanopart Res, 2004, Vol. 6, No. 4, pp: 325–354.
 23. Roco, MC., 2005, "International perspective on government nanotechnology funding in 2005", J Nanopart Res; Vol. 7, No. 6, pp: 707–712, Doi: 10.1007/s11051-005-3141-5.
 24. Kostoff, R.N., Koytcheff, R.G., Lau, C.G.Y., 2007, "Global nanotechnology research literature overview", Technological Forecasting & Social change, Vol. 74, pp: 1733-1747.
 25. Kostoff, R.N., Koytcheff, R.G., Lau, C.G.Y., 2007, "Structure of the global nanoscience and nanotechnology research literature", DTIC Technical Report Number ADA461930; Defense Technical Information Center; Fort Belvoir; VA.
 26. Kostoff, R.N., Koytcheff, R.G., Lau, C.G.Y., 2007, "Global nanotechnology research literature overview", Current Science, 92:11, June, pp: 1492-1498.
 27. Alencar, M.S.M., Porter, A.L., Antunes, A.M.S., 2007, "Nanopatenting patterns in relation product life cycle", Technological Forecasting & Social change; Vol. 74, pp: 1660-1680.
 28. Antunes, A., Canongia, C., Alencar, M.S.M., Mangueira, A.C., Tibau, F., Arnor, M., 2004, "Prospecção desenvolvimento científico de países_chave e países competidores [Nanotechnology Foresight: key and competitors countries]", (Study Commissioned by the CGEE/MCT), Rio de Janeiro: Information Industry, Escola de Química, Universidade Federal do Rio de Janeiro, Brazil.
 29. Li, x., Hu, D., Dang, Y., Chen, H., Roco, M.C., Larson, C.A., Chan, J., 2008, "Nano Mapper: an Internet knowledge mapping system for nanotechnology development", Journal of Nanoparticles Research, DOI 10.1007/s11051-008-9491-z.
 30. ISO/TS 27687, Nanotechnologies, terminology & definitions for nanoparticles.
 31. ISO/WD TS 11751, Nanotechnologies, terminology & definitions for carbon nanomaterials.
 32. ISO/WD TS 12921, Nanotechnologies, terminology & definitions for nanostructured materials.
 33. ISO/JWG 1- Ver.1 TR, Nanotechnologies, terminology, Framework for core concepts.
 34. BSI, PAS 133, Terminology for nanoscale measurement & instrumentation.
 35. BSI, PAS 135, Terminology for nanofabrication.
 36. BSI, PAS 71, Terminology for nanomaterials.
 37. BSI, PAS 71, Vocabulary / nanoparticles.
 38. Science Tree, Available from <http://www.nano.ir/sub_forsight.php?page= foresigh_Sci_Tree> (Cited at 2009/6/28).
 39. Industry Tree; Available from <http://www.nano.ir/sub_forsight.php?page= foresight_Ind_Tree> (Cited at 2009/6/28).
 40. Technology Tree; Available from <http://www.nano.ir/sub_forsight.php?page= foresight_Tech_Tree> (Cited at 2009/6/28).
 41. Salton, G., Wong, A., Yang, C.S., 1975, "A vector space model for automatic indexing", Communications of the ACM, Vol. 18, Issue 11, pp: 613-620.
 42. Rousseeuw, P.J., 1987, "Silhouettes: A graphical aid to the interpretation and validation of cluster analysis", Journal of Computational and Applied Mathematics, Vol. 20, pp: 53-65.