검색 상세

텍스트 마이닝을 활용한 국내 교육과정 연구 동향(2000~2020년) 분석

Analysis of Research Trends in Korea Curriculum Using Text Mining; Focusing on 2000~2020

초록/요약

After the founding of Korea, the national curriculum standards were introduced, and the curriculum changed several times, affecting the educational field. Various curriculum studies were conducted to identify and solve problems that occur according to the changing curriculum, or to introduce, settle, and evaluate the newly revised curriculum. Like IB, there have been studies to introduce new overseas curriculum research and practice trends or to find ways to apply them to Korea. A representative journal is “The Journal of Curriuculum” of the Society of for Curriculum Studies. In recent years, as interest in the curriculum has increased, various academic societies and journals have been created to actively discuss the curriculum. A series of research flows are also continuing to understand the research trends surrounding this curriculum. However, most of the studies focused on specific academic journals or used limited research methods. Therefore, the purpose of the study was to re-recognize and draw a blueprint for curriculum research trends by dealing with amounts of data that could not be covered by currently existing studies using text mining that can extract meaning from large amounts of text. For this purpose, the following research questions were derived. First, what is the time-series change in curriculum research? Second, what are the main keywords of curriculum research, and what are the characteristics? Third, What are the main topics of curriculum research, and what are the characteristics? In order to solve the problem of research, a study using text mining techniques was designed. The order of the study is setting analysis target, data cleaning, and text mining techniques. For the analysis data setting, detailed search functions of RISS (Web Scrapping) and KISS were used. When searching in detail, papers and academic papers published from 2000 to 2020 were set as KCI-level, doctoral-degree papers, and subject words were set as 'curriculum'. It was judged that it was difficult to derive papers related to the re-concept of the curriculum or related to classes by searching for the thesis title 'curriculum'. For example, among the academic papers published in The Journal of Curriuculum”, Kim Young-sil (2021)'s ‘‘Korean Alphabet Education Experiences and the Composition of Practical Knowledge for First-Grade Elementary School Teachers’ is excluded from the analysis data when searched for the title. In order to prevent such cases, the keyword was searched. After completing the setting, data collection was conducted from October 10, 2021 to October 20, 2021. 13,830 papers were selected as final data through the process of deleting duplicate data and deleting unnecessary data. This study used title, keyword, and abstract as analysis data because green contains the overall content of the thesis. In this study, among the titles, keywards and, abstracts, absctacts were used as analysis data. This is because the abstract contains the overall content of the thesis. Also, LDA analysis should be based on a certain amount of data like an abstract. Therefore, data cleaning was performed using the abstract of the thesis as data. For data cleaning, data pre-processing and morphological analysis were performed for the abstract. Data cleaning was pre-processed and morpheme analysis. For data preprocessing, normalization and terminology processing were performed, and KOMORAN was used for morpheme analysis. Analysis using text mining techniques was divided into time series analysis, keyword analysis, and topic modeling. All of the above processes were conducted using Python 3.6.12, and libraries and modules such as 'Pandas', 'Skleran', 'Matplotlib', 'Gensim', 'Mallet', and 'Wordcloud' were used. The results derived through the above process are as follows. First, in the time series analysis, the change trend of academic dissertations and dissertations showed an overall quantitative increase, but there was a partial difference. Academic papers showed significant changes in the above four sections: 2002-2003, 2007-2008, 2009-2011, and 2018-2019. The number of dissertations increased in 2005-2006, 2009-2010, 2016-2017, and 2019-2020. Looking at the trend of fluctuations, both academic thesis and degree thesis showed a quantitative increase over time. However, there was a tendency that there were many inflection points in the trend of the increase in degree thesis. Second, keyword analysis was performed for the entire analysis period and for each curriculum revision period. In the entire analysis period, ‘subject, teacher, learning, content, process, class, learner, development, textbook’ and ‘evaluation’ appeared as the top keywords in the analysis period. Mid-range keywards are ‘need, activity, school, method, purpose, utilization, composition, culture. management’ and ‘problem’ derived. As keywords in the lower ranks, 'recognition, understanding, knowledge, integration, change, ability, competence, goal, infant', and 'application' were derived. TF-IDF was conducted to supplement the results of simple keyword analysis. As the top keywords, 'revision, learning, textbook, class, teacher, teach, school subject, evaluation', and ‘2015’ were derived. As mid-range keywords were 'development, high school, managemnet, activity, university, 2009, composition, knowledge, method’, and ‘process’. As keywords in the lower ranks, 'understanding, recognition, goal, creative, problem, integration, national, comparison, kindergarten', and 'ability' appeared. As a result of keyword analysis by revision period, for example, the top keywords in the 2015 revised curriculum were 'subject, learning, teacher, content, class, course, development, learner, evaluation, textbook'. The mid-range keywords were 'need, competency, school, activity, purpose, method, utilization, management, composition, awareness'. The lower-order keywords were 'change, application, understanding, culture, problem, university, ability, goal, element, and plan'. The top keywords considering TF-IDF were ‘revision, 2015, content, learning, subject, class, textbook, analysis, elementary school, evaluation’. The mid-range keywords were 'competence, teacher, professor, school, development, high school, management, middle school, elementary school, core'. The keywords in the lower order were 'University, activity, knowledge, composition, NCS, society, practice, improvement, method, understanding'. Third, topic modeling was performed and analyzed by the entire period and revision period. The selection of the number of topics was based on the perplexity and coherence of topics. In the initial perplexity and coherence calculation, the figures after 20 topics tended to be consistent. For efficient research, the number of topics was analyzed focusing on values within 1 to 20. Among the calculation results, if multiple optimal topics were selected according to perplexity and coherence, the possibility of interpretation was examined after learning each topic number in the machine. In the analysis of the entire period, 14 topics were derived as the appropriate number of topics when the perplexity, coherence, and interpretability of topics were examined. Topics are: ① Curriculum development and evaluation ② Curriculum and learners ③ School curriculum and community ④ School curriculum improvement ⑤ Vocational curriculum ⑥ problem-solving skills ⑦ Teacher and early childhood curriculum ⑧ Education Process Theory ⑨ Curriculum and Society ⑩ Korean language curriculum ⑪ university curriculum ⑫ elementary curriculum ⑬ integrated curriculum effect ⑭ curriculum and textbooks appeared. the entire analysis period was completed, topic modeling for each revised curriculum was carried out in the same way. As a result, 13 topics were derived from the 7th revised curriculum, 13 from the 2007 revised curriculum, 16 from the 2009 revised curriculum, and 17 from the 2015 revised curriculum. In some cases, similar types of topics are derived for each revision period, but there was a tendency for different topics to appear when comparing lower keywords and upper topics for each revision period. Through these results, the following conclusions were drawn. First, Curriculum research in Korea is continuously expanding quantitatively. Academic thesis graph and thesis graph show a static distribution over time. At the point where the difference between the two graphs appeared, the graph of the academic thesis showed a gentle upward slope in general, but the graph of the thesis graph showed an upward slope in general, but there was a point where the curve appeared depending on the period. The implication of this is that the degree of academic interest in the curriculum increased overall, and the amount of papers increased when it coincided with the revision period or when each curriculum was established. This indicates that academic discussion on curriculum research is increasing in line with the revision. However, the difference is that the tendency of academic thesis and degree thesis to increase is different. Although the number of academic thesis continued to increase, the extent of dissertations varied greatly depending on the period. This is related to the inconsistent number of graduates in graduate schools. Second, when analyzing keywords, there was a difference between simple keyword analysis and TF-IDF analysis. Throughout the analysis period, the word with the highest keyword frequency was 'curriculum', but when analyzing TF-IDF, the highest was 'revision'. The fact that 'revision' appears high in TF-IDF analysis means that the word 'revision' is not a simple high frequency, but a very important keyword despite statistical processing. This suggests that Korean curriculum research is quite sensitive to 'revision'. On the contrary, keywords such as 'teacher', 'learning', 'textbook', 'class', and 'evaluation' are keywords with high frequency and high TF-IDF index. These keywords can be said to be keywords that can represent the field of curriculum research. In addition, it is a group of learners who experience the curriculum that appears when analyzing the TF-IDF of 'high school' and 'kindergarten'. "Kindergarten" is the youngest group of learners learning through the Nuri course, and "high school" is the last group to learn through the curriculum. The reinforcement of research interest in both end groups suggests that research interest in 'elementary school' and 'middle school' is relatively small. Looking at the TF-IDF by revision period, it can be seen that words that become a characteristic part of the curriculum have appeared for each revision period. The 7th revised curriculum period by level, the 2009 revised curriculum period by Nuri, and the 2015 revised curriculum period by competency and NCS appeared. This keyword appeared only in a specific curriculum period and was eliminated from the keyword of interest in research during other curriculum revisions. This indicates that as the curriculum in Korea is revised, curriculum research also temporarily changes. Third, When the topic modeling analysis is done, the subjects that generate a lot of academic discourse among the Korean curriculum research are 'Korean Language' and 'Social Studies'. When conducting the analysis, the names of each subject were replaced with 'subject', and each subject was placed on the same line and analyzed. Despite taking these measures, topics related to the 'Korean Language Curriculum' and ‘Social Studies Curriculum’ not only occupy the largest proportion of the entire period, but also appear in common during all revised curriculums. This indicates that the Department of Korean Language and Social Studies actively conducted academic discussions on curriculum research. However, the appearance of a few specific subjects alone rather than multiple subjects appearing as topics may raise concerns that the curriculum discussion will be focused on a specific subject in academic discussions about the curriculum. Fourth, adjacent school levels often appeared within the same topic. In particular, two topics were derived during the 2007 revised curriculum: the kindergarten-elementary curriculum and the university-high school curriculum, and the university-high school curriculum was derived during the 2015 revised curriculum. The derivation of these topics is an indicator of increased interest in curriculum operation through linkage between each school level after the 7th curriculum. In fact, with the advent of the Nuri course, studies on the kindergarten-elementary school linkage curriculum and studies were conducted to analyze the connection between high schools and universities due to the high school credit system. Fifth, academic discussions on the 2015 revised curriculum are taking place quite multidimensionally. The topics of the 2015 revised curriculum period are relatively higher than those of other periods. In addition, there are many topics related to the 2015 revised curriculum itself. In particular, topics such as the '2015 revised curriculum system' have already appeared even though topics related to the 'competency-oriented curriculum' have been derived. This is thought to reflect the tendency to overemphasize ‘competence’ in the 2015 revised curriculum. And ‘2015 Revised Curriculum System’ is an area related to the content system. With the introduction of the 2015 revised curriculum, the content system of all subjects was unified. In this situation, it is thought that each curriculum curriculum continued research in the relevant field and expressed dissatisfaction with the current method. Such a content system and enforcement of achievement standards do not fully reflect the unique identity and characteristics of each curriculum, so it cannot but work against each subject. Considering the incompleteness of this study, suggestions for follow-up research are as follows. First, this study used topic modeling in terms of research method as a study to analyze curriculum research trends. Topic modeling also includes methods such as DTM and TOT other than LDA used in this study. Since LDA is an analysis centered on a specific period, it is difficult to observe time-series changes. To compensate for this, models such as Dynamic Topic Modeling (DTM) and Topic Over Time (TOT) were created. However, the assumptions premised on both models were not used because they did not fit this study. However, if the research data match the premise assumed by the model, it is necessary to attempt an analysis other than LDA analysis. Second, as the number of targets for analysis increases, a more rigorous preprocessing process and morpheme analysis process are required. In this study, about 500 word dictionaries were constructed for preprocessing, and about 150 words were corrected for normalization and non-verbal processing. Nevertheless, words that were not continuously derived occurred. To solve this problem, it suggests that an unsupervised learning Korean extractor can be used instead of using the Tokenizer method such as KR-WordRank, or that there is a way to increase the validity in interpreting the results by increasing the semantic unit using bigram. Third, it is necessary to add a research method that can alalysis much deeply likewise, conduct semantic network analysis or Focus Group Interviews (FGI). In this study, TF-IDF was calculated and the value of TF-IDF of each word was derived, but semantic network analysis was not conducted with these values. Adding semantic network analysis will increase the validity of the analysis results. Or, listening expert opinions and revise the topic based on data comparing the subject and abstract of each topic through interviews with previous researchers groups, the validity of the study results will increase.

more

초록/요약

우리나라는 건국 후 국가수준 교육과정기준이 도입되었고, 교육과정은 여러 차례 변모하여 교육 현장에 영향을 주었다. 변화하는 교육과정에 따라 발생되는 문제를 파악하고 해결하기 위하여 또는 새롭게 개정된 교육과정의 소개와 안착 및 평가를 위한 다양한 교육과정 연구가 진행되었다. IB처럼 해외의 새로운 교육과정 연구와 실천 동향을 소개하거나 이를 우리나라에 적용할 방도를 찾는 연구도 있었다. 대표적인 학술지로 한국교육과정학회의『교육과정연구』가 있다. 최근에 올수록 교육과정에 대한 관심도가 증가함에 따라 다양한 학회와 학술지가 생겨나 교육과정에 대한 학술적 논의가 활발해졌다. 이러한 교육과정을 둘러싼 연구 동향을 파악하고자 하는 일련의 연구 흐름도 이어지고 있다. 다만, 이런 연구들은 특정 학술지를 중심으로 하거나, 한정적 연구방법을 사용한 연구가 대부분이었다. 이에 본 연구는 대량의 텍스트에서 의미를 추출할 수 있는 텍스트 마이닝을 활용하여 기존의 연구가 다루지 않은 양의 데이터를 다루며, 교육과정 연구 동향에 대한 재인식 및 청사진을 그리는 것을 목적으로 하였다. 이러한 목적으로 다음과 같은 연구 문제를 설정하였다. 첫째, 교육과정 연구의 시계열적 변화는 어떠한가? 둘째, 교육과정 연구의 주요 키워드는 무엇이며, 어떠한 특징이 나타나는가? 셋째, 교육과정 연구의 주요 토픽은 무엇이며, 어떠한 특징이 나타나는가? 위의 연구 문제를 해결하기 위하여 텍스트 마이닝 기법을 활용한 연구를 설계하였다. 연구의 순서는 분석대상 설정, 데이터 클리닝 그리고 텍스트 마이닝 기법을 활용한 분석이다. 분석데이터 설정은 RISS(Web Scraping 사용)와 KISS의 상세검색 기능을 사용하였다. 상세검색 시, 2000~2020년까지 발간된 논문, 학술논문은 KCI급, 학위논문은 박사학위논문 그리고 주제어는 ‘교육과정’으로 설정하였다. 논문 제목을 기준으로 검색하면, 교육과정 재개념과 관련되거나 수업 관련 논문이 도출되지 못하였다. 예를 들어, 『교육과정연구』에 실린 학술논문 중, 김영실(2021)의 ‘초등학교 1학년 교사들의 한글 교육 경험과 실천적 지식의 구성’은 논문 제목에 ‘교육과정’이 포함되지 않아, 제목을 기준으로 검색하였을 때는 분석데이터에서 제외된다. 이러한 사례를 줄이기 위하여 주제어 ‘교육과정’을 기준으로 설정하였다. 해당 설정을 마친 후 2021년 10월 10일부터 2021년 10월 20일까지 데이터 수집을 진행하였다. 중복데이터 삭제 및 불필요 데이터 삭제 과정을 거치면서 13,830건의 논문이 최종 데이터로 선정되었다. 본 연구는 제목, 키워드, 초록 중 초록을 분석데이터로 삼았는데, 이는 초록이 논문의 전반적 내용을 포함하고 있기 때문이다. 따라서 논문의 초록을 데이터로 삼아 데이터 클리닝을 진행하였다. 데이터 클리닝은 초록을 대상으로 데이터 전처리와 형태소 분석이 이루어졌다. 데이터 전처리는 정규화와 불용어 처리가 진행되었으며, 형태소 분석은 KOMORAN을 사용하였다. 텍스트 마이닝 기법을 활용한 분석은 시계열 분석, 키워드 분석, 토픽모델링으로 구분하였다. 이상의 과정은 모두 Python 3.6.12를 활용하여 진행하였으며, ‘Pandas’, ‘Sklearn’, ‘Matplotlib’, ‘Gensim’, ‘Mallet’, ‘Wordcloud’ 등의 라이브러리 및 모듈이 사용되었다. 위의 과정을 거쳐, 도출된 결과는 다음과 같다. 첫째, 시계열 분석에서 학술논문의 변화 추이와 학위논문의 변화추이는 전반적으로 양적 증가를 보이지만, 부분적인 차이가 나타났다. 학술논문은 2002~2003년, 2007~2008년, 2009~2011년 그리고 2018~2019년, 이상의 4구간에서 큰 변화의 폭을 보였다. 학위논문은 2005~2006년, 2009~2010년, 2016~2017년 그리고 2019~2020년에 증가하는 폭을 보였다. 변동의 경향성을 보면, 학술논문과 학위논문 모두 시간이 지날수록 양적 증가가 나타났다. 다만, 학위논문의 증가 추이는 계단식으로 나타나는 경향이 있었다. 둘째, 전체 기간 및 교육과정 개정 시기별 키워드 분석을 하였다. 분석 기간 전체 키워드 분석에서 상위권 키워드로 ‘교과, 교사, 학습, 내용, 과정, 수업, 학습자, 개발, 교과서, 평가’가, 중위권 키워드로, ‘필요, 활동, 학교, 방법, 목적, 활용, 구성, 문화, 운영, 문제’가 그리고 하위권 키워드로 ‘인식, 이해, 지식, 통합, 변화, 능력, 역량, 목표, 유아, 적용’이 도출되었다. 단순 키워드 분석의 결과를 보완하기 위하여 TF-IDF를 실시하였다. 상위권 키워드로 ‘개정, 학습, 교과서, 수업, 교사, 교수, 학교, 교과, 평가, 2015’ 도출되었다. 중위권 키워드는 ‘개발, 고등학교, 운영, 활동, 대학, 2009, 구성, 지식, 방법, 과정’이 나타났다. 하위권 키워드로 ‘이해, 인식, 목표, 창의적, 문제, 통합, 국가, 비교, 유치원, 능력’이 나타났다. 개정 시기별 키워드 분석결과, 가령 2015 개정 교육과정의 상위권 키워드는 ‘교과, 학습, 교사, 내용, 수업, 과정, 개발, 학습자, 평가, 교과서’였다. 중위권 키워드는 ‘필요, 역량, 학교, 활동, 목적, 방법, 활용, 운영, 구성, 인식’이었다. 하위권 키워드는 ‘변화, 적용, 이해, 문화, 문제, 대학, 능력, 목표, 요소, 방안’이었다. TF-IDF를 고려한 상위권 키워드는 ‘개정, 2015, 내용, 학습, 교과, 수업, 교과서, 분석, 초등학교, 평가’였다. 중위권 키워드는 ‘역량, 교사, 교수, 학교, 개발, 고등학교, 운영, 중학교, 초등, 핵심’이었다. 하위권 키워드는 ‘대학, 활동, 지식, 구성, NCS, 사회, 실제, 개선, 방법, 이해’였다. 셋째, 토픽모델링을 실시하여 전체 기간 및 개정 시기별로 토픽을 분석하였다. 토픽의 개수 선정은 토픽의 혼잡도와 응집성을 기준점으로 삼았다. 최초 혼잡도 및 응집성을 계산에서 토픽이 20개 이후부터 수치가 일관되는 경향성을 보였다. 효율적인 연구를 위하여 토픽의 개수는 1~20개 이내 수치를 중심으로 분석하였다. 계산 결과 중, 혼잡도와 응집성에 따라 최적의 토픽이 복수로 선택되는 경우는 각각의 토픽 개수를 머신에 학습시킨 후 해석가능성을 살폈다. 전체 기간 분석 시, 토픽의 응집성, 혼잡도 그리고 해석 가능성을 살폈을 때, 14개의 토픽이 적절한 토픽의 개수로 도출되었다. 토픽은 ① 교육과정 개발과 평가, ② 교육과정과 학습자, ③ 교육과정 효과, ④ 학교교육과정 개선, ⑤ 직업교육과정, ⑥ 문제해결력, ⑦ 교사 및 유아 교육과정, ⑧ 교육과정이론, ⑨ 교육과정과 사회, ⑩ 국어과 교육과정, ⑪ 대학 교육과정, ⑫ 초등 교육과정, ⑬ 통합 교육과정, ⑭ 교육과정과 교과서가 나타났다. 분석 기간 전체에 대한 분석을 마친 이후 동일한 방식으로 각 개정 교육과정에 대한 토픽모델링을 실시하였다. 분석결과는 7차 개정 교육과정은 13개, 2007 개정 교육과정은 13개, 2009 개정 교육과정은 16개, 2015 개정 교육과정은 17개 토픽이 도출되었다. 각 개정 시기별로 비슷한 유형의 토픽이 도출되었으나, 최근에 올수록 토픽은 다양해지고 그 개수도 늘어났다. 위의 과정을 거쳐, 도출된 결과는 다음과 같다. 첫째, 시계열 분석에서 학술논문의 변화 추이와 학위논문의 변화추이는 전반적으로 양적 증가를 보이지만, 부분적인 차이가 나타났다. 학술논문은 2002~2003년, 2007~2008년, 2009~2011년 그리고 2018~2019년, 이상의 4구간에서 큰 변화의 폭을 보였다. 학위논문은 2005~2006년, 2009~2010년, 2016~2017년 그리고 2019~2020년에 증가하는 폭을 보였다. 변동의 경향성을 보면, 학술논문과 학위논문 모두 시간이 지날수록 양적 증가가 나타났다. 다만, 학위논문의 증가 추이는 계단식으로 나타나는 경향이 있었다. 둘째, 전체 기간 및 교육과정 개정 시기별 키워드 분석을 하였다. 분석 기간 전체 키워드 분석에서 상위권 키워드로 ‘교과, 교사, 학습, 내용, 과정, 수업, 학습자, 개발, 교과서, 평가’가, 중위권 키워드로, ‘필요, 활동, 학교, 방법, 목적, 활용, 구성, 문화, 운영, 문제’가 그리고 하위권 키워드로 ‘인식, 이해, 지식, 통합, 변화, 능력, 역량, 목표, 유아, 적용’이 도출되었다. 단순 키워드 분석의 결과를 보완하기 위하여 TF-IDF를 실시하였다. 상위권 키워드로 ‘개정, 학습, 교과서, 수업, 교사, 교수, 학교, 교과, 평가, 2015’ 도출되었다. 중위권 키워드는 ‘개발, 고등학교, 운영, 활동, 대학, 2009, 구성, 지식, 방법, 과정’이 나타났다. 하위권 키워드로 ‘이해, 인식, 목표, 창의적, 문제, 통합, 국가, 비교, 유치원, 능력’이 나타났다. 개정 시기별 키워드 분석결과, 가령 2015 개정 교육과정의 상위권 키워드는 ‘교과, 학습, 교사, 내용, 수업, 과정, 개발, 학습자, 평가, 교과서’였다. 중위권 키워드는 ‘필요, 역량, 학교, 활동, 목적, 방법, 활용, 운영, 구성, 인식’이었다. 하위권 키워드는 ‘변화, 적용, 이해, 문화, 문제, 대학, 능력, 목표, 요소, 방안’이었다. TF-IDF를 고려한 상위권 키워드는 ‘개정, 2015, 내용, 학습, 교과, 수업, 교과서, 분석, 초등학교, 평가’였다. 중위권 키워드는 ‘역량, 교사, 교수, 학교, 개발, 고등학교, 운영, 중학교, 초등, 핵심’이었다. 하위권 키워드는 ‘대학, 활동, 지식, 구성, NCS, 사회, 실제, 개선, 방법, 이해’였다. 셋째, 토픽모델링을 실시하여 전체 기간 및 개정 시기별로 토픽을 분석하였다. 토픽의 개수 선정은 토픽의 혼잡도와 응집성을 기준점으로 삼았다. 최초 혼잡도 및 응집성을 계산에서 토픽이 20개 이후부터 수치가 일관되는 경향성을 보였다. 효율적인 연구를 위하여 토픽의 개수는 1~20개 이내 수치를 중심으로 분석하였다. 계산 결과 중, 혼잡도와 응집성에 따라 최적의 토픽이 복수로 선택되는 경우는 각각의 토픽 개수를 머신에 학습시킨 후 해석가능성을 살폈다. 전체 기간 분석 시, 토픽의 응집성, 혼잡도 그리고 해석 가능성을 살폈을 때, 14개의 토픽이 적절한 토픽의 개수로 도출되었다. 토픽은 ① 교육과정 개발과 평가, ② 교육과정과 학습자, ③ 교육과정 효과, ④ 학교교육과정 개선, ⑤ 직업 교육과정, ⑥ 문제해결력, ⑦ 교사 및 유아 교육과정, ⑧ 교육과정 이론, ⑨ 교육과정과 사회, ⑩ 국어과 교육과정, ⑪ 대학 교육과정, ⑫ 초등 교육과정, ⑬ 통합 교육과정, ⑭ 교육과정과 교과서가 나타났다. 분석 기간 전체에 대한 분석을 마친 이후 동일한 방식으로 각 개정 교육과정에 대한 토픽모델링을 실시하였다. 분석결과는 7차 개정 교육과정은 13개, 2007 개정 교육과정은 13개, 2009 개정 교육과정은 16개, 2015 개정 교육과정은 17개 토픽이 도출되었다. 각 개정 시기별로 비슷한 유형의 토픽이 도출되었으나, 최근에 올수록 토픽은 다양해지고 그 개수도 늘어났다. 이와 같은 결과를 통하여 다음과 같은 결론이 도출되었다. 첫째, 국내 교육과정 연구는 지속적으로 양적 팽창하고 있다. 학술논문 그래프 및 학위논문 그래프가 시간이 경과함에 따라 정적 분포를 보인다. 두 그래프의 차이가 나타나는 지점은 학술논문 그래프의 경우 전반적으로 완만한 우상향 그래프를 보였지만, 학위논문 그래프는 전반적으로 우상향이나 시기에 따라 굴곡이 나타나는 지점이 있었다. 이에 대한 시사점은 교육과정에 대한 학문적 관심도는 전반적으로 증가하였으며, 개정 시기와 맞물리거나 각 교육과정이 정착되는 시기에 논문의 양이 증가하였다. 이는 개정에 맞추어 교육과정 연구에 대한 학문적 논의가 증대됨을 나타낸다. 다만 차이점으로는 학술논문과 학위논문이 증가하는 경향성이 다르다. 학술논문은 지속적으로 증가하지만, 학위논문은 시기에 따라 변동의 폭이 컸다. 이는 대학원의 졸업자 수가 일정하지 않은 것과 연관이 있다. 둘째, 단순 키워드 분석과 TF-IDF 분석을 통한 몇 가지 특징을 도출하였다. 먼저, 분석 기간 전체에서 키워드 빈출이 가장 높게 나타난 단어는 ‘교과’ 였으나, TF-IDF 분석 시, 가장 높게 나타난 키워드는 ‘개정’이다. ‘개정’이 TF-IDF 분석 시, 가장 높게 등장한다는 것은 통계적 처리를 하였음에도 불구하고 ‘개정’이라는 단어가 상당히 중요한 키워드이다. 이는 교육과정 연구가 ‘개정’에 상당히 민감하게 반응한다는 것을 시사한다. 이와 반대로, ‘교사’, ‘학습’, ‘교과서’, ‘수업’, ‘평가’와 같은 키워드는 빈도가 높으면서 TF-IDF 지수도 높은 키워드이다. 이들 키워드는 교육과정 연구 분야를 대표할 수 있는 키워드라고 할 수 있다. 또한, TF-IDF 분석 시, 학교급별로 차이가 나타난다. 고등학교’와 ‘유치원’은 교육과정을 경험하는 학습자 집단을 나타내는 키워드이다. ‘유치원’은 누리과정을 통하여 학습하는 가장 어린 학습자 집단이고, ‘고등학교’는 교육과정을 통하여 학습하는 가장 마지막 단계에 있는 집단이다. 양 끝 집단에 대한 연구 관심도의 강화는 ‘초등학교’, ‘중학교’ 연구 관심도가 상대적으로 적다는 것을 시사한다. 마지막으로 개정 시기별 TF-IDF를 살펴볼 경우는 각 개정 시기별로 교육과정 특징적인 부분이 되는 단어들이 등장한 것을 알 수 있다. 7차 개정 교육과정기의 ‘수준별’, 2009 개정 교육과정기 시기의 ‘누리과정’, 2015 개정교육과정기의 ‘역량’과 ‘NCS’ 가 등장한다. 해당 키워드는 특정 교육과정기에만 등장하고 다른 교육과정 시기에선 연구 관심의 키워드에서 탈락된다. 이것은 우리나라 교육과정의 개정에 따라, 교육과정 연구 또한 일시적으로 변화함을 시사한다. 셋째, 토픽 모델링 분석을 하였을 때, 우리나라 교과 교육과정 연구 중 상당히 많은 학술적 담론을 생성하는 교과는 ‘국어과’와 ‘사회과’ 이다. 분석을 시행할 때, 각 교과의 이름을 모두 ‘교과’로 치환하면서 각 교과를 모두 동일 선상에 놓고 분석하였다. 이러한 조치를 취했음에도 ‘국어과 교육과정’과 ‘사회과 교육과정’ 관련된 토픽은 전체 시기에서 가장 많은 비중을 차지할 뿐만 아니라, 모든 개정 교육과정기에 공통으로 등장한다. 이는 국어과가 교육과정 및 사회과 교육과정에 대한 학술적 논의를 활발히 하였음을 나타낸다. 하지만 다양한 복수 교과가 토픽으로 등장하는 것이 아닌 특정한 몇 개의 교과가 단독적으로 등장하는 것은 교과 교육과정에 대한 학술적 논의 시, 특정 교과를 중심으로 교육과정 논의가 진행될 우려를 낳을 수 있다. 넷째, 인접한 학교급이 동일한 토픽 내에 등장하는 경우가 많았다. 특히, 2007 개정 교육과정 시기는 ‘유-초 교육과정’과 ‘대학-고교 교육과정’이라는 두 개의 토픽이 도출되었으며, 2015 개정 교육과정기 시기에는 ‘대학-고교 교육과정’이 토픽이 도출되었다. 이러한 토픽들의 도출은 7차 교육과정 이후 각 학교급간 연계를 통한 교육과정 운영에 관심이 높아졌다는 것을 나타내는 지표이다. 실제로 누리과정의 등장으로 유-초 연계 교육과정에 대한 연구, 고교학점제로 인하여 고교-대학 간의 연계성을 분석하는 연구가 진행되었다. 다섯째, 2015 개정 교육과정의 학술적 논의는 상당히 다차원적으로 이루어지고 있다. 2015 개정 교육과정기의 토픽은 다른 시기의 토픽보다 상대적으로 많은 편이다. 또한, 2015 개정 교육과정 이외의 개정 교육과정에서는 각 교육과정의 특징 하나의 토픽으로 뭉치는 경향이 강하나, 2015 개정 교육과정은 ‘역량 중심 교육과정’, ‘2015 개정 교육과정 체계’라는 두 개의 토픽이 도출되었다. 이것은 2015 개정 교육과정에서 ‘역량’을 지나치게 강조한 경향이 반영되었다고 생각된다. 그리고 ‘2015 개정 교육과정 체계’는 내용체계와 관련된 영역이다. 2015 개정 교육과정의 도입과 함께 모든 교과의 내용체계가 일원화되었고, 그로 인하여 성취기준의 형태와 내용이 총론에 의하여 강요받을 수밖에 없었다. 이 상황은 각 교과교육과정이 해당 분야의 연구를 지속하여 현재의 방식에 대한 불만을 표출하였다고 생각된다. 이러한 내용체계 및 성취기준 강요는 각 교과교육과정이 고유의 정체성 및 특성을 온전히 반영하지 못하여, 각 교과에 불리하게 작용될 수밖에 없다. 본 연구의 미진한 점을 고려하여 후속연구를 위한 제언은 다음과 같다. 첫째, 본 연구는 교육과정의 연구 동향을 분석하는 연구로 연구 방법적 측면에서 토픽모델링을 사용하였다. 토픽 모델링은 본 연구에서 사용한 LDA 이외의 DTM, TOT와 같은 방법도 있다. LDA는 특정 기간을 중심으로 한 분석이기에 시계열적인 변화를 관측하기에는 어려움이 있다. 이를 보완하기 위하여 DTM(Dynamic Topic Modeling)과 TOT(Topic Over Time)과 같은 모형이 만들어졌다. 다만, 두 모형 모두 전제하고 있는 가정들이 본 연구와 맞지 않아 사용하지 못하였다. 후속연구 시에 해당 모형이 가정하고 있는 전제와 맞는다면 LDA 분석이 아닌 다른 분석을 시도할 필요가 있다. 둘째, 분석대상이 많아진 만큼 더욱 엄밀한 전처리 과정과 형태소 분석 과정이 필요하다. 본 연구도 전처리를 위하여 약 500개 정도의 단어사전을 구축하였으며, 정규화 및 불용어 처리 작업을 위하여 약 150개 정도의 단어를 고쳤다. 그럼에도 지속적으로 도출되지 않는 단어가 발생하였다. 따라서, 후속연구에서는 토크나이져 방식이 아닌, KR-WordRank와 같이 비지도 학습 방식의 한국어 추출기를 사용하거나, bigram을 사용하여 의미 단위를 늘려 결과 해석 시 타당함을 높일 수 있는 방법이 있음을 시시한다. 셋째, 분석의 깊이를 더 할 수 있는 연구 방법이 추가될 필요가 있다. 예를 들어, 의미연결망 분석 혹은 전문가 집단 인터뷰(FGI) 등을 추가적으로 할 필요가 있다. 본 연구에서 TF-IDF까지 구하여 해당 각 단어가 가지는 TF-IDF의 수치까지는 도출하였으나, 이러한 수치를 가지고 의미연결망 분석을 실행하지 못하였다. 의미연결망 분석을 추가한다면, 분석결과의 타당성을 높일 수 있을 것이다. 혹은 전문가 그룹 인터뷰를 통하여 각 토픽의 주제와 초록 등을 비교한 자료를 토대로 전문가의 의견을 듣고 토픽의 수정하는 작업을 거친다면 연구 결과의 타당성이 높아질 것이다.

more

목차

<목 차>
Ⅰ. 서론 1
1. 연구의 필요성 및 목적 1
2. 연구의 문제와 주요 내용 5
3. 연구의 절차와 방법 6
4. 용어의 정의 6
5. 연구의 제한점 7

Ⅱ. 이론적 배경 8
1. 국내 교육과정 변천 9
1) 7차 이전 9
2) 7차 개정 교육과정 13
3) 2007 개정 교육과정 17
4) 2009 개정 교육과정 18
5) 2015 개정 교육과정 21
6) 국내 교육과정 연구 동향 분석 선행 연구 분석 25
2. 텍스트 마이닝 29
1) 텍스트 마이닝의 개념 및 특징 29
2) 텍스트 마이닝의 분석 절차와 방법 30
3) 텍스트 마이닝을 활용한 교육 관련 연구 연구 동향 분석 선행연구 탐색 39

Ⅲ. 연구 방법 44
1. 분석대상 44
2. 데이터 클리닝 49
3. 분석 방법 및 시각화 53


Ⅳ. 국내 교육과정 연구 동향 분석 58
1. 시계열 분석 58
2. 키워드 분석 61
1) 분석 기간 전체 61
2) 교육과정 개정 시기별 키워드 분석 65
3. 토픽모델링 69
1) 분석 기간 전체 69
2) 7차 개정 교육과정기 75
2) 2007 개정 교육과정기 78
3) 2009 개정 교육과정기 82
4) 2015 개정 교육과정기 86

Ⅴ. 요약, 결론 및 제언 90
1. 요약 91
2. 결론 93
3. 제언 96

※ 참 고 문 헌 98
※ ABSTRACT 109

more