심리 과학자처럼 생각하기(Thinking like a Psychological Scientist)

심리 과학자처럼 생각하기

By

California Baptist University

We are bombarded every day with claims about how the world works, claims that have a direct impact on how we think about and solve problems in society and our personal lives. This module explores important considerations for evaluating the trustworthiness of such claims by contrasting between scientific thinking and everyday observations (also known as “anecdotal evidence”).

우리는 매일 세상이 어떻게 돌아가는지에 대한 주장, 즉 사회와 개인 생활의 문제를 생각하고 해결하는 방식에 직접적인 영향을 미치는 주장에 휩싸여 있습니다. 이 모듈에서는 과학적 사고와 일상적인 관찰("일화적 증거"라고도 함)을 대조하여 이러한 주장의 신뢰성을 평가할 때 고려해야 할 중요한 사항을 살펴봅니다.

학습 목표

  • Compare and contrast conclusions based on scientific and everyday inductive reasoning. 
  • Understand why scientific conclusions and theories are trustworthy, even if they are not able to be proven.
  • Articulate what it means to think like a psychological scientist, considering qualities of good scientific explanations and theories. 
  • Discuss science as a social activity, comparing and contrasting facts and values.
  • 과학적 추론과 일상적인 귀납적 추론에 근거한 결론을 비교하고 대조합니다.
  • 과학적 결론과 이론이 증명할 수 없더라도 신뢰할 수 있는 이유를 이해합니다.
  • 좋은 과학적 설명과 이론의 특성을 고려하여 심리 과학자처럼 생각한다는 것이 무엇을 의미하는지 명확하게 설명합니다. 
  • 사실과 가치를 비교하고 대조하면서 사회적 활동으로서의 과학에 대해 토론합니다.

서문

Why are some people so much happier than others? Is it harmful for children to have imaginary companions? How might students study more effectively?

왜 어떤 사람들은 다른 사람들보다 훨씬 더 행복할까? 아이들이 상상 속 친구를 갖는 것이 해롭나요? 어떻게 하면 학생들이 더 효과적으로 공부할 수 있을까요?

An illustration depicting a man with a digital information tidal wave of 1s and 0s about to break over his head.
Today, people are overwhelmed with information although it varies in quality. [Image: Mark Smiciklas, https://goo.gl/TnZCoH, CC BY-NC 2.0, https://goo.gl/AGYuo9]

Even if you’ve never considered these questions before, you probably have some guesses about their answers. Maybe you think getting rich or falling in love leads to happiness. Perhaps you view imaginary friends as expressions of a dangerous lack of realism. What’s more, if you were to ask your friends, they would probably also have opinions about these questions—opinions that may even differ from your own.

이러한 질문을 한 번도 생각해 본 적이 없더라도 그 답에 대해 어느 정도 짐작할 수 있을 것입니다. 부자가 되거나 사랑에 빠지는 것이 행복으로 이어진다고 생각할 수도 있습니다. 상상 속 친구를 위험한 현실감 결여의 표현으로 여길 수도 있습니다. 게다가 친구에게 물어본다면 친구도 이러한 질문에 대한 의견을 가지고 있을 것이고, 그 의견은 여러분과 다를 수도 있습니다.

A quick internet search would yield even more answers. We live in the “Information Age,” with people having access to more explanations and answers than at any other time in history. But, although the quantity of information is continually increasing, it’s always good practice to consider the quality of what you read or watch: Not all information is equally trustworthy. The trustworthiness of information is especially important in an era when “fake news,” urban myths, misleading “click-bait,” and conspiracy theories compete for our attention alongside well-informed conclusions grounded in evidence. Determining what information is well-informed is a crucial concern and a central task of science. Science is a way of using observable data to help explain and understand the world around us in a trustworthy way.

인터넷 검색만 빠르게 해도 더 많은 답을 얻을 수 있습니다. 우리는 '정보화 시대'에 살고 있으며, 사람들은 역사상 그 어느 때보다 더 많은 설명과 답을 접할 수 있습니다. 하지만 정보의 양은 지속적으로 증가하고 있지만, 항상 읽거나 시청하는 정보의 질을 고려하는 것이 좋습니다: 모든 정보가 똑같이 신뢰할 수 있는 것은 아닙니다. 가짜 뉴스, 도시괴담, 자극적인 기사, 음모론 등이 증거에 기반한 결론의 옆에서 우리 관심을 끌어당기기 위해 경쟁하는 시대에 정보의 신뢰성은 특히 중요합니다. 어떤 정보가 근거가 있는 정보인지 판단하는 것은 중요한 관심사이자 과학의 핵심 과제입니다. 과학은 관찰 가능한 데이터를 사용하여 신뢰할 수 있는 방식으로 우리 주변의 세계를 설명하고 이해하는 데 도움을 주는 방법입니다.

In this module, you will learn about scientific thinking. You will come to understand how scientific research informs our knowledge and helps us create theories. You will also come to appreciate how scientific reasoning is different from the types of reasoning people often use to form personal opinions.

이 모듈에서는 과학적 사고에 대해 배웁니다. 과학적 연구가 어떻게 우리의 지식에 정보를 제공하고 이론을 만드는 데 도움이 되는지 이해하게 될 것입니다. 또한 과학적 추론이 사람들이 개인적인 의견을 형성할 때 자주 사용하는 종류의 추론과 어떻게 다른지 이해하게 될 것입니다.

과학 vs 일상적 추론

Each day, people offer statements as if they are facts, such as, “It looks like rain today,” or, “Dogs are very loyal.” These conclusions represent hypotheses about the world: best guesses as to how the world works. Scientists also draw conclusions, claiming things like, “There is an 80% chance of rain today,” or, “Dogs tend to protect their human companions.” You’ll notice that the two examples of scientific claims use less certain language and are more likely to be associated with probabilities. Understanding the similarities and differences between scientific and everyday (non-scientific) statements is essential to our ability to accurately evaluate the trustworthiness of various claims.

사람들은 매일 "오늘은 비가 올 것 같다." 또는 "개는 충성심이 강하다."와 같이 사실인 것처럼 말합니다.. 이러한 결론은 세상에 대한 가설, 즉 세상이 어떻게 작동하는지에 대한 최선의 추측을 나타냅니다. 과학자들도 "오늘 비가 올 확률이 80%이다." 또는 "개는 인간 동반자를 보호하는 경향이 있다."와 같은 결론을 도출합니다. 과학적 주장의 두 가지 예는 덜 확실한 언어를 사용하며 확률과 연관될 가능성이 더 높다는 것을 알 수 있습니다. 과학적 진술과 일상적(비과학적) 문장의 유사점과 차이점을 이해하는 것은 다양한 주장의 신뢰성을 정확하게 평가하는 능력에 필수적입니다.

Scientific and everyday reasoning both employ induction: drawing general conclusions from specific observations. For example, a person’s opinion that cramming for a test increases performance may be based on her memory of passing an exam after pulling an all-night study session. Similarly, a researcher’s conclusion against cramming might be based on studies comparing the test performances of people who studied the material in different ways (e.g., cramming versus study sessions spaced out over time). In these scenarios, both scientific and everyday conclusions are drawn from a limited sample of potential observations.

과학적 추론과 일상적 추론 모두 특정 관찰에서 일반적인 결론을 도출하는 귀납법을 사용합니다. 예를 들어, 벼락치기가 시험 성적을 높인다는 사람의 의견은 밤새도록 공부한 후 시험에 합격한 기억에 근거할 수 있습니다. 마찬가지로 벼락치기에 반대하는 연구자의 결론은 다양한 방식으로 자료를 공부한 사람들의 시험 성적을 비교한 연구(예: 벼락치기와 시간 간격을 두고 공부한 세션)를 근거로 할 수 있습니다. 이러한 시나리오에서는 과학적 결론과 일상적인 결론 모두 잠재적인 관찰의 제한된 샘플에서 도출됩니다.

The process of induction, alone, does not seem suitable enough to provide trustworthy information—given the contradictory results. What should a student who wants to perform well on exams do? One source of information encourages her to cram, while another suggests that spacing out her studying time is the best strategy. To make the best decision with the information at hand, we need to appreciate the differences between personal opinions and scientific statements, which requires an understanding of science and the nature of scientific reasoning.

귀납의 과정만으로는 모순된 결과를 고려할 때 신뢰할 수 있는 정보를 제공하기에 충분하지 않은 것 같습니다. 시험에서 좋은 성적을 내고 싶은 학생은 어떻게 해야 할까요? 어떤 정보는 벼락치기를 하라고 부추기고, 또 다른 정보는 공부 시간을 분산하는 것이 최선의 전략이라고 제안합니다. 당면한 정보로 최선의 결정을 내리려면 개인적인 의견과 과학적 진술 사이의 차이를 인식해야 하며, 이를 위해서는 과학과 과학적 추론의 본질에 대한 이해가 필요합니다.

There are generally agreed-upon features that distinguish scientific thinking—and the theories and data generated by it—from everyday thinking. A short list of some of the commonly cited features of scientific theories and data is shown in Table 1.

과학적 사고와 그에 의해 생성된 이론 및 데이터를 일상적 사고와 구별하는 일반적으로 합의된 특징이 있습니다. 일반적으로 인용되는 과학 이론과 데이터의 특징 몇 가지가 표 1에 나와 있습니다.

Table 1. Features of good scientific theories (Kuhn, 2011)

One additional feature of modern science not included in this list but prevalent in scientists’ thinking and theorizing is falsifiability, a feature that has so permeated scientific practice that it warrants additional clarification. In the early 20th century, Karl Popper (1902-1994) suggested that science can be distinguished from pseudoscience (or just everyday reasoning) because scientific claims are capable of being falsified. That is, a claim can be conceivably demonstrated to be untrue. For example, a person might claim that “all people are right handed.” This claim can be tested and—ultimately—thrown out because it can be shown to be false: There are people who are left-handed. An easy rule of thumb is to not get confused by the term “falsifiable” but to understand that—more or less—it means testable.

이 목록에 포함되지 않았지만 과학자들의 사고와 이론에 널리 퍼져 있는 현대 과학의 또 다른 특징은 과학적 관행에 깊이 스며들어 있는 반증 가능성이며, 이에 대한 추가적인 설명이 필요합니다. 20세기 초, 칼 포퍼(1902~1994)는 과학적 주장은 반증될 수 있기 때문에 과학을 유사과학(또는 일상적인 추론)과 구별할 수 있다고 제안했습니다. 즉, 어떤 주장이 사실이 아닌 것으로 입증될 수 있다는 것입니다. 예를 들어, 어떤 사람이 "모든 사람은 오른손잡이"라고 주장할 수 있습니다. 이 주장은 검증을 거쳐 거짓임이 밝혀질 수 있으므로 궁극적으로 폐기될 수 있습니다: 왼손잡이도 있습니다. '반증 가능'이라는 용어에 혼동하지 말고 검증이 가능하다는 의미로 이해하는 것이 좋습니다.

On the other hand, some claims cannot be tested and falsified. Imagine, for instance, that a magician claims that he can teach people to move objects with their minds. The trick, he explains, is to truly believe in one’s ability for it to work. When his students fail to budge chairs with their minds, the magician scolds, “Obviously, you don’t truly believe.” The magician’s claim does not qualify as falsifiable because there is no way to disprove it. It is unscientific.

반면에 어떤 주장은 검증하거나 반증할 수 없습니다. 예를 들어 마술사가 사람들에게 마음으로 물건을 움직일 수 있다고 주장한다고 가정해 봅시다. 비결은 자신의 능력을 진정으로 믿는 것이라고 그는 설명합니다. 학생들이 마음으로 의자를 움직이지 못하자 마술사는 "분명히 당신은 진정으로 믿지 않는군요."라고 꾸짖습니다. 마술사의 주장은 반증할 방법이 없기 때문에 반증 가능성에 부합하지 않습니다. 비과학적입니다.

Popper was particularly irritated about nonscientific claims because he believed they were a threat to the science of psychology. Specifically, he was dissatisfied with Freud’s explanations for mental illness. Freud believed that when a person suffers a mental illness it is often due to problems stemming from childhood. For instance, imagine a person who grows up to be an obsessive perfectionist. If she were raised by messy, relaxed parents, Freud might argue that her adult perfectionism is a reaction to her early family experiences—an effort to maintain order and routine instead of chaos. Alternatively, imagine the same person being raised by harsh, orderly parents. In this case, Freud might argue that her adult tidiness is simply her internalizing her parents’ way of being. As you can see, according to Freud’s rationale, both opposing scenarios are possible; no matter what the disorder, Freud’s theory could explain its childhood origin—thus failing to meet the principle of falsifiability.

포퍼는 비과학적인 주장이 심리학의 과학에 위협이 된다고 믿었기 때문에 비과학적인 주장에 특히 짜증을 냈습니다. 특히 그는 정신 질환에 대한 프로이트의 설명에 불만을 품었습니다. 프로이트는 사람이 정신 질환을 앓는 것은 어린 시절의 문제 때문인 경우가 많다고 믿었습니다. 예를 들어 강박적인 완벽주의자로 자란 사람을 상상해 보세요. 이 사람이 지저분하고 느긋한 부모 밑에서 자랐다면 프로이트는 성인이 된 후의 완벽주의가 혼란 대신 질서와 일상을 유지하려는 노력과 같은 초기 가족 경험에 대한 반응이라고 주장할 수 있습니다. 또는 같은 사람이 가혹하고 질서정연한 부모 밑에서 자랐다고 상상해 보세요. 이 경우 프로이트는 성인이 된 그녀의 깔끔함은 단순히 부모의 존재 방식을 내면화한 것이라고 주장할 수 있습니다. 보시다시피, 프로이트의 이론에 따르면 두 가지 상반된 시나리오가 모두 가능하며, 어떤 장애든 프로이트의 이론으로 어린 시절의 기원을 설명할 수 있으므로 반증 가능성의 원칙을 충족하지 못합니다.

Karl Popper
Karl Popper was an influential thinker regarding scientific theory and reasoning. [Image: Lucinda Douglas-Menzies, https://goo.gl/uuqxCe]

Popper argued against statements that could not be falsified. He claimed that they blocked scientific progress: There was no way to advance, refine, or refute knowledge based on such claims. Popper’s solution was a powerful one: If science showed all the possibilities that were not true, we would be left only with what is true. That is, we need to be able to articulate—beforehand—the kinds of evidence that will disprove our hypothesis and cause us to abandon it.

포퍼는 반증할 수 없는 주장에 반대했습니다. 그는 이러한 주장이 과학적 진보를 가로막는다고 주장했습니다: 그러한 주장에 근거하여 지식을 발전시키거나, 구체화하거나, 반박할 방법이 없었기 때문입니다. 포퍼의 해결책은 강력한 것이었습니다: 과학이 사실이 아닌 모든 가능성을 보여준다면 사실만 남게 될 것입니다.. 즉, 가설을 반증하고 가설을 포기하게 만드는 증거를 미리 명확하게 제시할 수 있어야 한다는 것입니다.

This may seem counterintuitive. For example, if a scientist wanted to establish a comprehensive understanding of why car accidents happen, she would systematically test all potential causes: alcohol consumption, speeding, using a cell phone, fiddling with the radio, wearing sandals, eating, chatting with a passenger, etc. A complete understanding could only be achieved once all possible explanations were explored and either falsified or not. After all the testing was concluded, the evidence would be evaluated against the criteria for falsification, and only the real causes of accidents would remain. The scientist could dismiss certain claims (e.g., sandals lead to car accidents) and keep only those supported by research (e.g., using a mobile phone while driving increases risk). It might seem absurd that a scientist would need to investigate so many alternative explanations, but it is exactly how we rule out bad claims. Of course, many explanations are complicated and involve multiple causes—as with car accidents, as well as psychological phenomena.

이는 직관적이지 않은 것처럼 보일 수 있습니다. 예를 들어, 한 과학자가 자동차 사고가 발생하는 이유를 종합적으로 이해하고자 한다면 음주, 과속, 휴대폰 사용, 라디오 조작, 샌들 착용, 식사, 동승자와의 대화 등 모든 잠재적 원인을 체계적으로 테스트할 것입니다. 가능한 모든 원인을 조사하고 반증 가능성을 확인해야만 완전한 이해를 얻을 수 있었습니다. 모든 실험이 끝나면 증거를 반증 가능성의 기준에 따라 평가하고 실제 원인만 남게 됩니다. 과학자는 특정 주장(예: 샌들이 자동차 사고를 유발한다)을 기각하고 연구로 뒷받침되는 주장(예: 운전 중 휴대전화를 사용하면 위험이 증가한다)만 유지할 수 있습니다. 과학자가 그렇게 많은 대체 설명을 조사해야 한다는 것이 터무니없어 보일 수도 있지만, 이것이 바로 우리가 잘못된 주장을 배제하는 방법입니다. 물론 자동차 사고와 같이 심리적 현상도 많은 설명과 복잡하고 여러 가지 원인이 관련되어 있습니다.

테스트해보세요: 반증할 수 있나요?

Which of the following hypotheses can be falsified? For each, be sure to consider what kind of data could be collected to demonstrate that a statement is not true.

다음 중 반증될 수 있는 가설은 어느 것입니까? 각각에 대해, 문장이 사실이 아님을 입증하기 위해 어떤 종류의 데이터를 수집할 수 있는지 생각해 보세요.

A. Chocolate tastes better than pasta.

B. We live in the most violent time in history.

C. Time can run backward as well as forward.

D. There are no planets other than Earth that have water on them.

A. 초콜릿은 파스타보다 더 맛있다.

B. 우리는 역사상 가장 폭력적인 시대에 살고 있다.

C. 시간은 앞으로뿐만 아니라 뒤로 갈 수도 있다.

D. 지구 외에 물이 있는 행성은 없다.

[See answer at end of this module]

Although the idea of falsification remains central to scientific data and theory development, these days it’s not used strictly the way Popper originally envisioned it. To begin with, scientists aren’t solely interested in demonstrating what isn’t. Scientists are also interested in providing descriptions and explanations for the way things are. We want to describe different causes and the various conditions under which they occur. We want to discover when young children start speaking in complete sentences, for example, or whether people are happier on the weekend, or how exercise impacts depression. These explorations require us to draw conclusions from limited samples of data. In some cases, these data seem to fit with our hypotheses and in others they do not. This is where interpretation and probability come in.

반증 가능성이라는 개념은 여전히 과학적 자료와 이론 개발의 핵심이지만, 오늘날에는 포퍼가 원래 구상한 방식대로 엄격하게 사용되지는 않습니다. 우선, 과학자들은 사실이 아닌 것을 증명하는 데에만 관심이 있는 것이 아닙니다. 과학자들은 어떤 것에 대한 설명을 제공하는 데에도 관심이 있습니다. 우리는 다양한 원인과 그 원인이 발생하는 다양한 조건을 설명하고자 합니다. 예를 들어, 어린 아이들이 언제부터 완전한 문장으로 말하기 시작하는지, 주말에 사람들이 더 행복해지는지, 운동이 우울증에 어떤 영향을 미치는지 등을 알아보고자 합니다. 이러한 탐구를 위해서는 제한된 데이터 샘플에서 결론을 도출해야 합니다. 어떤 경우에는 이러한 데이터가 우리의 가설에 부합하는 것처럼 보이지만 어떤 경우에는 그렇지 않은 경우도 있습니다. 이때 해석과 확률이 중요한 역할을 합니다.

연구 결과 해석

Imagine a researcher wanting to examine the hypothesis—a specific prediction based on previous research or scientific theory—that caffeine enhances memory. She knows there are several published studies that suggest this might be the case, and she wants to further explore the possibility. She designs an experiment to test this hypothesis. She randomly assigns some participants a cup of fully caffeinated tea and some a cup of herbal tea. All the participants are instructed to drink up, study a list of words, then complete a memory test. There are three possible outcomes of this proposed study:

카페인이 기억력을 향상시킨다는 가설(이전 연구나 과학적 이론에 근거한 특정 예측)을 조사하고자 하는 연구자가 있다고 가정해 보겠습니다. 이 연구자는 카페인이 기억력을 향상시킨다는 가설을 뒷받침하는 여러 연구가 발표된 것을 알고 있으며, 그 가능성을 더 탐구하고 싶어 합니다. 그녀는 이 가설을 테스트하기 위해 실험을 설계합니다. 그녀는 일부 참가자에게는 카페인이 가득한 차 한 잔을, 일부 참가자에게는 허브차 한 잔을 무작위로 배정합니다. 모든 참가자에게 차를 다 마시고 단어 목록을 공부한 다음 기억력 테스트를 완료하라는 지시를 내립니다. 이 연구에서 세 가지 결과가 나올 수 있습니다:

A diagram showing that two groups, one caffeinated and one decaffeinated, are asked to study and then given a memory test.
  1. The caffeine group performs better (support for the hypothesis).
  2. The no-caffeine group performs better (evidence against the hypothesis).
  3. There is no difference in the performance between the two groups (also evidence against the hypothesis).

 

  1. 카페인 그룹이 더 낫다 (가설을 지지).
  2. 카페인을 먹지 않은 그룹이 더 낫다 (가설에 반함).
  3. 두 그룹 사이에 퍼포먼스에는 차이가 없다 (역시 가설에 반함).

Let’s look, from a scientific point of view, at how the researcher should interpret each of these three possibilities.

과학적 관점에서 연구자가 이 세 가지 가능성을 각각 어떻게 해석해야 하는지 살펴봅시다.

First, if the results of the memory test reveal that the caffeine group performs better, this is a piece of evidence in favor of the hypothesis: It appears, at least in this case, that caffeine is associated with better memory. It does not, however, prove that caffeine is associated with better memory. There are still many questions left unanswered. How long does the memory boost last? Does caffeine work the same way with people of all ages? Is there a difference in memory performance between people who drink caffeine regularly and those who never drink it? Could the results be a freak occurrence? Because of these uncertainties, we do not say that a study—especially a single study—proves a hypothesis. Instead, we say the results of the study offer evidence in support of the hypothesis. Even if we tested this across 10 thousand or 100 thousand people we still could not use the word “proven” to describe this phenomenon. This is because inductive reasoning is based on probabilities. Probabilities are always a matter of degree; they may be extremely likely or unlikely. Science is better at shedding light on the likelihood—or probability—of something than at proving it. In this way, data is still highly useful even if it doesn’t fit Popper’s absolute standards.

첫째, 기억력 테스트 결과 카페인을 섭취한 그룹의 성적이 더 좋았다면 이는 가설을 뒷받침하는 증거가 될 수 있습니다: 적어도 이 경우에는 카페인이 기억력 향상과 관련이 있는 것으로 보입니다. 그러나 카페인이 기억력 향상과 관련이 있다는 것을 증명하지는 못합니다. 아직 풀리지 않은 의문이 많이 남아 있습니다. 기억력 향상 효과는 얼마나 오래 지속되나요? 카페인은 모든 연령대의 사람들에게 동일한 방식으로 작용하나요? 카페인을 정기적으로 마시는 사람과 전혀 마시지 않는 사람 사이에 기억력 향상에 차이가 있나요? 이런 결과가 우연일 수도 있나요? 이러한 불확실성 때문에 우리는 연구, 특히 단일 연구가 가설을 증명한다고 말하지 않습니다. 대신 연구 결과가 가설을 뒷받침하는 증거를 제공한다고 말합니다. 1만 명 또는 10만 명을 대상으로 테스트하더라도 이 현상을 설명하는 데 '입증'이라는 단어를 사용할 수 없습니다. 귀납적 추론은 확률에 기반하기 때문입니다. 확률은 항상 정도의 문제이며, 매우 가능성이 높을 수도 있고 낮을 수도 있습니다. 과학은 어떤 것을 증명하는 것보다 그 가능성, 즉 확률을 밝히는 데 더 능숙합니다. 따라서 데이터는 포퍼의 절대적인 기준에 부합하지 않더라도 여전히 매우 유용합니다.

The science of meteorology helps illustrate this point. You might look at your local weather forecast and see a high likelihood of rain. This is because the meteorologist has used inductive reasoning to create her forecast. She has taken current observations—lots of dense clouds coming toward your city—and compared them to historical weather patterns associated with rain, making a reasonable prediction of a high probability of rain. The meteorologist has not proven it will rain, however, by pointing out the oncoming clouds.

기상학은 이 점을 설명하는 데 도움이 됩니다. 지역 일기 예보를 보면 비가 올 확률이 높다는 것을 알 수 있습니다. 이는 기상학자가 귀납적 추론을 사용하여 예보를 작성했기 때문입니다. 기상학자는 현재 관측 자료(도시로 다가오는 짙은 구름)를 비와 관련된 과거 날씨 패턴과 비교하여 비가 올 확률이 높다는 합리적인 예측을 한 것입니다. 하지만 기상학자는 다가오는 구름을 가리키는 것으로 비가 올 것이라는 것을 증명하지는 못했습니다.

Proof is more associated with deductive reasoning. Deductive reasoning starts with general principles that are applied to specific instances (the reverse of inductive reasoning). When the general principles, or premises, are true, and the structure of the argument is valid, the conclusion is, by definition, proven; it must be so. A deductive truth must apply in all relevant circumstances. For example, all living cells contain DNA. From this, you can reason—deductively—that any specific living cell (of an elephant, or a person, or a snake) will therefore contain DNA. Given the complexity of psychological phenomena, which involve many contributing factors, it is nearly impossible to make these types of broad statements with certainty.

증명은 연역적 추론과 더 관련이 있습니다. 연역적 추론은 특정 사례에 적용되는 일반 원칙에서 시작합니다(귀납적 추론의 반대). 일반 원칙 또는 전제가 참이고 논증의 구조가 타당하다면 결론은 정의에 따라 증명된 것이며, 반드시 그래야 합니다. 연역적 진실은 모든 관련 상황에서 적용되어야 합니다. 예를 들어, 모든 살아있는 세포에는 DNA가 포함되어 있습니다. 이로부터 코끼리, 사람, 뱀 등 특정 살아있는 세포에는 DNA가 포함되어 있을 것이라고 연역적으로 추론할 수 있습니다. 여러 가지 요인이 복합적으로 작용하는 심리 현상의 복잡성을 고려할 때, 이러한 유형의 광범위한 진술을 확실하게 하는 것은 거의 불가능합니다.

테스트 2: 귀납적 vs 연역적?

A. The stove was on and the water in the pot was boiling over. The front door was standing open. These clues suggest the homeowner left unexpectedly and in a hurry.

B. Gravity is associated with mass. Because the moon has a smaller mass than the Earth, it should have weaker gravity.

C. Students don’t like to pay for high priced textbooks. It is likely that many students in the class will opt not to purchase a book.

D. To earn a college degree, students need 100 credits. Janine has 85 credits, so she cannot graduate. 

A. 스토브가 켜져 있었고 냄비의 물이 끓고 있었습니다. 현관문이 열려 있었습니다. 이 단서들은 집주인이 예기치 않게 서둘러 집을 나갔다는 것을 암시합니다.

B. 중력은 질량과 관련이 있습니다. 달은 지구보다 질량이 작기 때문에 중력이 약할 것입니다.

C. 학생들은 고가의 교과서 비용을 지불하는 것을 좋아하지 않습니다. 학급의 많은 학생이 책을 구매하지 않을 가능성이 높습니다.

D. 대학 학위를 취득하려면 100학점이 필요합니다. 재닌은 학점이 85학점이므로 졸업할 수 없습니다. 

[See answer at end of this module] 

The second possible result from the caffeine-memory study is that the group who had no caffeine demonstrates better memory. This result is the opposite of what the researcher expects to find (her hypothesis). Here, the researcher must admit the evidence does not support her hypothesis. She must be careful, however, not to extend that interpretation to other claims. For example, finding increased memory in the no-caffeine group would not be evidence that caffeine harms memory. Again, there are too many unknowns. Is this finding a freak occurrence, perhaps based on an unusual sample? Is there a problem with the design of the study? The researcher doesn’t know. She simply knows that she was not able to observe support for her hypothesis.

카페인-기억력 연구의 두 번째 가능한 결과는 카페인을 섭취하지 않은 그룹이 더 나은 기억력을 보일 경우입니다. 이 결과는 연구자가 기대한 결과(가설)와는 정반대입니다. 여기서 연구자는 증거가 자신의 가설을 뒷받침하지 못한다는 사실을 인정해야 합니다. 그러나 그 해석을 다른 주장으로 확장하지 않도록 주의해야 합니다. 예를 들어, 카페인을 섭취하지 않은 그룹에서 기억력이 향상되었다고 해서 카페인이 기억력에 해를 끼친다는 증거가 될 수는 없습니다. 다시 말하지만, 아직 밝혀지지 않은 것이 너무 많습니다. 이 결과가 비정상적인 샘플에 근거한 기이한 결과일까요? 연구 설계에 문제가 있는 것일까요? 연구자도 모릅니다. 다만 가설을 뒷받침하는 증거를 관찰할 수 없었다는 것만 알고 있을 뿐입니다.

There is at least one additional consideration: The researcher originally developed her caffeine-benefits-memory hypothesis based on conclusions drawn from previous research. That is, previous studies found results that suggested caffeine boosts memory. The researcher’s single study should not outweigh the conclusions of many studies. Perhaps the earlier research employed participants of different ages or who had different baseline levels of caffeine intake. This new study simply becomes a piece of fabric in the overall quilt of studies of the caffeine-memory relationship. It does not, on its own, definitively falsify the hypothesis.

한 가지 더 고려해야 할 사항이 있습니다: 연구자는 원래 이전 연구에서 도출된 결론을 바탕으로 카페인이 기억력에 도움이 된다는 가설을 세웠습니다. 즉, 이전 연구에서 카페인이 기억력을 향상시킨다는 결과를 발견했습니다. 연구자의 단일 연구가 여러 연구의 결론을 능가해서는 안 됩니다. 아마도 이전 연구에서는 연령대가 다르거나 카페인 섭취 기준치가 다른 참가자를 대상으로 했을 것입니다. 이 새로운 연구는 카페인과 기억력의 관계에 대한 전체적인 연구 결과의 한 조각에 불과합니다. 그 자체만으로는 가설이 완전히 틀렸다고 단정할 수 없습니다.

Finally, it’s possible that the results show no difference in memory between the two groups. How should the researcher interpret this? How would you? In this case, the researcher once again has to admit that she has not found support for her hypothesis. 

마지막으로, 두 그룹 간에 기억력에 차이가 없는 결과가 나왔을 수도 있습니다. 연구자는 이를 어떻게 해석해야 할까요? 여러분은 어떻게 생각하시나요? 이 경우 연구자는 자신의 가설에 대한 근거를 찾지 못했음을 다시 한 번 인정해야 합니다. 

Interpreting the results of a study—regardless of outcome—rests on the quality of the observations from which those results are drawn. If you learn, say, that each group in a study included only four participants, or that they were all over 90 years old, you might have concerns. Specifically, you should be concerned that the observations, even if accurate, aren’t representative of the general population. This is one of the defining differences between conclusions drawn from personal anecdotes and those drawn from scientific observations. Anecdotal evidence—derived from personal experience and unsystematic observations (e.g., “common sense,”)—is limited by the quality and representativeness of observations, and by memory shortcomings. Well-designed research, on the other hand, relies on observations that are systematically recorded, of high quality, and representative of the population it claims to describe.

연구 결과를 해석하는 것은 결과가 아닌 연구 결과를 도출한 관찰의 질에 달려 있습니다. 예를 들어, 연구에 참여한 각 그룹에 참가자가 4명만 포함되어 있거나 참가자가 모두 90세 이상이라는 사실을 알게 된다면 우려를 가질 수 있습니다. 특히 관찰 결과가 정확하더라도 일반 인구를 대표하지 않을 수 있다는 점을 염두에 두어야 합니다. 이것이 개인적인 일화에서 도출된 결론과 과학적 관찰에서 도출된 결론 사이의 결정적인 차이점 중 하나입니다. 개인적인 경험과 체계적이지 않은 관찰(예: '상식')에서 도출된 일화적 증거는 관찰의 질과 대표성, 기억의 결함에 의해 제한됩니다. 반면에 잘 설계된 연구는 체계적으로 기록되고 품질이 높으며 설명하고자 하는 집단을 대표할 수 있는 관찰에 의존합니다.

그 무엇도 증명할 수 없다면 왜 과학을 믿어야 할까?

It’s worth delving a bit deeper into why we ought to trust the scientific inductive process, even when it relies on limited samples that don’t offer absolute “proof.” To do this, let’s examine a widespread practice in psychological science: null-hypothesis significance testing.

절대적인 "증거"를 제공하지 않는 제한된 샘플에 의존하는 경우에도 과학적 귀납적 과정을 신뢰해야 하는 이유를 좀 더 자세히 살펴볼 필요가 있습니다. 이를 위해 심리학에서 널리 사용되는 방법인 영가설 유의성 검증을 살펴보겠습니다.

A male and female student work together at a table and focus on details in a notebook in front of them.
Is there a relationship between student age and academic performance? How could we research this question? How confident can we be that our observations reflect reality? [Image: Jeremy Wilburn, https://goo.gl/i9MoJb, CC BY-NC-ND 2.0, https://goo.gl/SjTsDg]

To understand this concept, let’s begin with another research example. Imagine, for instance, a researcher is curious about the ways maturity affects academic performance. She might have a hypothesis that mature students are more likely to be responsible about studying and completing homework and, therefore, will do better in their courses. To test this hypothesis, the researcher needs a measure of maturity and a measure of course performance. She might calculate the correlation—or relationship—between student age (her measure of maturity) and points earned in a course (her measure of academic performance). Ultimately, the researcher is interested in the likelihood—or probability—that these two variables closely relate to one another. Null-hypothesis significance testing (NHST) assesses the probability that the collected data (the observations) would be the same if there were no relationship between the variables in the study. Using our example, the NHST would test the probability that the researcher would find a link between age and class performance if there were, in reality, no such link.

이 개념을 이해하기 위해 다른 연구 사례부터 살펴보겠습니다. 예를 들어 성숙도가 학업 성취도에 어떤 영향을 미치는지 궁금한 연구자가 있다고 가정해 보겠습니다. 연구자는 성숙한 학생이 공부하고 숙제를 완수하는 데 더 책임감 있게 임할 가능성이 높으며, 따라서 수업 성적이 더 좋을 것이라는 가설을 세울 수 있습니다. 이 가설을 테스트하려면 연구자는 성숙도 측정값과 코스 성과 측정값이 필요합니다. 연구자는 학생의 나이(성숙도 측정값)와 코스에서 획득한 점수(학업 성취도 측정값) 간의 상관관계 또는 관계를 계산할 수 있습니다. 궁극적으로 연구자는 이 두 변수가 서로 밀접하게 관련되어 있을 가능성, 즉 확률에 관심이 있습니다. 영가설 유의성 검정(NHST)은 연구에서 변수 간에 관계가 없을 경우 수집된 데이터(관찰 결과)가 동일할 확률을 평가합니다. 예를 들어, NHST는 연구자가 나이와 수업 성과 사이에 실제로는 아무런 연관성이 없는 경우 연구자가 연관성을 발견할 확률을 테스트합니다.

Now, here’s where it gets a little complicated. NHST involves a null hypothesis, a statement that two variables are not related (in this case, that student maturity and academic performance are not related in any meaningful way). NHST also involves an alternative hypothesis, a statement that two variables are related (in this case, that student maturity and academic performance go together). To evaluate these two hypotheses, the researcher collects data. The researcher then compares what she expects to find (probability) with what she actually finds (the collected data) to determine whether she can falsify, or reject, the null hypothesis in favor of the alternative hypothesis.

이제 여기서 조금 복잡해집니다. NHST에는 두 변수가 서로 관련이 없다는 가설인 영가설이 포함됩니다(이 경우 학생 성숙도와 학업 성과는 의미 있는 방식으로 관련이 없다는 가설). NHST에는 두 변수가 서로 관련되어 있다는 가설인 대립 가설도 포함됩니다(이 경우 학생 성숙도와 학업 성취도는 서로 관련이 있다는 가설). 이 두 가설을 평가하기 위해 연구자는 데이터를 수집합니다. 그런 다음 연구자는 발견할 것으로 예상되는 것(확률)과 실제로 발견한 것(수집된 데이터)을 비교하여 대립 가설을 지지하기 위해 귀무 가설을 반증할 수 있는지 또는 거부할 수 있는지 결정합니다.

How does she do this? By looking at the distribution of the data. The distribution is the spread of values—in our example, the numeric values of students’ scores in the course. The researcher will test her hypothesis by comparing the observed distribution of grades earned by older students to those earned by younger students, recognizing that some distributions are more or less likely. Your intuition tells you, for example, that the chances of every single person in the course getting a perfect score are lower than their scores being distributed across all levels of performance.

어떻게 그럴 수 있을까요? 데이터의 분포를 살펴보면 됩니다. 분포는 값의 분포(이 예에서는 코스에서 학생의 점수 수치)입니다. 연구원은 관찰된 고학년 학생이 받은 성적 분포와 저학년 학생이 받은 성적 분포를 비교하여 가설을 테스트하고, 일부 분포가 더 많거나 적다는 것을 인식합니다. 예를 들어, 직관에 따르면 코스에 참여한 모든 사람이 만점을 받을 확률은 모든 수준의 성과에 걸쳐 분포된 점수보다 낮습니다.

The researcher can use a probability table to assess the likelihood of any distribution she finds in her class. These tables reflect the work, over the past 200 years, of mathematicians and scientists from a variety of fields. You can see, in Table 2a, an example of an expected distribution if the grades were normally distributed (most are average, and relatively few are amazing or terrible). In Table 2b, you can see possible results of this imaginary study, and can clearly see how they differ from the expected distribution.

연구자는 확률 표를 사용하여 수업에서 찾은 분포의 가능성을 평가할 수 있습니다. 이 표는 지난 200년 동안 다양한 분야의 수학자와 과학자들이 수행한 연구를 반영합니다. 표 2a에서는 성적이 정규 분포인 경우 예상되는 분포의 예를 볼 수 있습니다(대부분이 평균이고 상대적으로 소수의 성적이 뛰어나거나 형편없는 경우). 표 2b에서는 이 가상의 연구에서 가능한 결과를 볼 수 있으며, 예상 분포와 어떻게 다른지 명확하게 확인할 수 있습니다.

In the process of testing these hypotheses, there are four possible outcomes. These are determined by two factors: 1) reality, and 2) what the researcher finds (see Table 3). The best possible outcome is accurate detection. This means that the researcher’s conclusion mirrors reality. In our example, let’s pretend the more mature students do perform slightly better. If this is what the researcher finds in her data, her analysis qualifies as an accurate detection of reality. Another form of accurate detection is when a researcher finds no evidence for a phenomenon, but that phenomenon doesn’t actually exist anyway! Using this same example, let’s now pretend that maturity has nothing to do with academic performance. Perhaps academic performance is instead related to intelligence or study habits. If the researcher finds no evidence for a link between maturity and grades and none actually exists, she will have also achieved accurate detection.

이러한 가설을 테스트하는 과정에서 네 가지 결과가 나올 수 있습니다. 이는 두 가지 요소에 의해 결정됩니다: 1) 현실과 2) 연구자가 발견한 것(표 3 참조). 가장 좋은 결과는 정확한 탐지입니다. 이는 연구자의 결론이 현실을 반영한다는 것을 의미합니다. 이 예에서는 좀 더 성숙한 학생들의 성적이 약간 더 좋다고 가정해 봅시다. 연구자가 데이터에서 이러한 사실을 발견했다면, 연구자의 분석은 현실을 정확하게 감지한 것으로 인정받을 수 있습니다. 정확한 탐지의 또 다른 형태는 연구자가 어떤 현상에 대한 증거를 찾지 못했지만 그 현상은 실제로 존재하지 않는 경우입니다! 이 같은 예를 사용하여 이제 성숙도가 학업 성적과 관련이 없다고 가정해 봅시다. 학업 성적은 지능이나 공부 습관과 관련이 있을 수도 있습니다. 연구자가 성숙도와 성적 사이의 연관성에 대한 증거를 찾지 못하고 실제로 존재하지 않는다면, 연구자는 정확한 탐지를 달성한 것입니다.

Table 2a (Above): Expected grades if there were no difference between the two groups. Table 2b (Below): Course grades by age

There are a couple of ways that research conclusions might be wrong. One is referred to as a type I error—when the researcher concludes there is a relationship between two variables but, in reality, there is not. Back to our example: Let’s now pretend there’s no relationship between maturity and grades, but the researcher still finds one. Why does this happen? It may be that her sample, by chance, includes older students who also have better study habits and perform better: The researcher has “found” a relationship (the data appearing to show age as significantly correlated with academic performance), but the truth is that the apparent relationship is purely coincidental—the result of these specific older students in this particular sample having better-than-average study habits (the real cause of the relationship). They may have always had superior study habits, even when they were young.

연구 결론이 잘못될 수 있는 방법에는 몇 가지가 있습니다. 하나는 연구자가 두 변수 간에 관계가 있다고 결론을 내렸지만 실제로는 관계가 없는 경우로, 유형 I 오류라고 합니다. 다시 예로 돌아가 보겠습니다: 이제 성숙도와 성적 사이에는 아무런 관계가 없지만 연구자가 여전히 관계를 발견했다고 가정해 봅시다. 왜 이런 일이 발생할까요? 연구자의 표본에 우연히도 공부 습관이 더 좋고 성적이 더 좋은 고학년 학생이 포함되어 있기 때문일 수 있습니다: 연구자는 관계를 '발견'했지만(데이터가 나이와 학업 성취도가 유의미한 상관관계가 있는 것처럼 보임), 사실 이 겉으로 보이는 관계는 순전히 우연이며, 이 특정 표본의 특정 고학년 학생들이 평균보다 더 나은 학습 습관을 가졌기 때문(관계의 실제 원인)입니다. 그들은 어렸을 때부터 항상 우수한 공부 습관을 가지고 있었을 수도 있습니다.

Another possible outcome of NHST is a type II error, when the data fail to show a relationship between variables that actually exists. In our example, this time pretend that maturity is —in reality—associated with academic performance, but the researcher doesn’t find it in her sample. Perhaps it was just her bad luck that her older students are just having an off day, suffering from test anxiety, or were uncharacteristically careless with their homework: The peculiarities of her particular sample, by chance, prevent the researcher from identifying the real relationship between maturity and academic performance.

NHST의 또 다른 가능한 결과는 데이터에서 실제로 존재하는 변수 간의 관계를 보여주지 못하는 유형 II 오류입니다. 이 예에서는 성숙도가 실제로는 학업 성과와 관련이 있지만 연구자가 표본에서 이를 발견하지 못했다고 가정해 보겠습니다. 아마도 그녀의 고학년 학생들이 시험 불안에 시달리거나 평소와 다르게 숙제에 부주의한 것은 그녀의 불운이었을 것입니다: 우연히도 특정 표본의 특성으로 인해 연구자는 성숙도와 학업 성취도 사이의 실제 관계를 파악할 수 없습니다.

These types of errors might worry you, that there is just no way to tell if data are any good or not. Researchers share your concerns, and address them by using probability values (p-values) to set a threshold for type I or type II errors. When researchers write that a particular finding is “significant at a p < .05 level,” they’re saying that if the same study were repeated 100 times, we should expect this result to occur—by chance—fewer than five times. That is, in this case, a Type I error is unlikely. Scholars sometimes argue over the exact threshold that should be used for probability. The most common in psychological science are .05 (5% chance), .01 (1% chance), and .001 (1/10th of 1% chance). Remember, psychological science doesn’t rely on definitive proof; it’s about the probability of seeing a specific result. This is also why it’s so important that scientific findings be replicated in additional studies.

이러한 유형의 오류는 데이터의 유효성 여부를 알 수 있는 방법이 없다는 점에서 걱정될 수 있습니다. 연구자들은 사용자의 우려를 공유하며, 확률 값(p값)을 사용하여 유형 I 또는 유형 II 오류에 대한 임계값을 설정함으로써 이러한 문제를 해결합니다. 연구자가 특정 결과가 "p < .05 수준에서 유의미함"이라고 적는다는 것은 동일한 연구를 100번 반복할 경우 이 결과가 나올 확률이 5회 미만일 것으로 예상해야 한다는 뜻입니다. 즉, 이 경우 유형 I 오류는 발생하지 않을 가능성이 높습니다. 학자들은 때때로 확률에 사용해야 하는 정확한 임계값에 대해 논쟁을 벌이기도 합니다. 심리학에서 가장 많이 사용되는 임계값은 0.05(5% 확률), 0.01(1% 확률), 0.001(1% 확률의 1/10)입니다. 심리학은 확실한 증거에 의존하는 것이 아니라 특정 결과를 볼 수 있는 확률에 관한 것임을 기억하세요. 그렇기 때문에 과학적 연구 결과를 추가 연구에서 재현하는 것이 매우 중요합니다.

A table contrasting Type 1 and Type 2 errors as described in the text.
Table 3: Accurate detection and errors in research

It’s because of such methodologies that science is generally trustworthy. Not all claims and explanations are equal; some conclusions are better bets, so to speak. Scientific claims are more likely to be correct and predict real outcomes than “common sense” opinions and personal anecdotes. This is because researchers consider how to best prepare and measure their subjects, systematically collect data from large and—ideally—representative samples, and test their findings against probability.

과학이 일반적으로 신뢰할 수 있는 것은 이러한 방법론 때문입니다. 모든 주장과 설명이 동일한 것은 아니며, 말하자면 어떤 결론이 더 나은 내기라고 할 수 있습니다. 과학적 주장은 '상식적인' 의견이나 개인적인 일화보다 정확하고 실제 결과를 예측할 가능성이 더 높습니다. 연구자들은 피험자를 가장 잘 준비하고 측정하는 방법을 고려하고, 이상적으로 대표성이 있는 대규모 샘플에서 체계적으로 데이터를 수집하며, 발견한 결과를 확률과 비교하여 테스트하기 때문입니다.

과학적 이론

The knowledge generated from research is organized according to scientific theories. A scientific theory is a comprehensive framework for making sense of evidence regarding a particular phenomenon. When scientists talk about a theory, they mean something different from how the term is used in everyday conversation. In common usage, a theory is an educated guess—as in, “I have a theory about which team will make the playoffs,” or, “I have a theory about why my sister is always running late for appointments.” Both of these beliefs are liable to be heavily influenced by many untrustworthy factors, such as personal opinions and memory biases. A scientific theory, however, enjoys support from many research studies, collectively providing evidence, including, but not limited to, that which has falsified competing explanations. A key component of good theories is that they describe, explain, and predict in a way that can be empirically tested and potentially falsified.

연구를 통해 생성된 지식은 과학 이론에 따라 정리됩니다. 과학 이론은 특정 현상에 관한 증거를 이해하기 위한 포괄적인 틀입니다. 과학자들이 이론에 대해 이야기할 때는 일상적인 대화에서 이 용어가 사용되는 방식과는 다른 의미로 사용됩니다. 일반적으로 이론은 "어느 팀이 플레이오프에 진출할지에 대한 이론이 있다." 또는 "누나가 왜 항상 약속 시간에 늦는지에 대한 이론이 있다."와 같이 교육적인 추측을 말합니다. 이러한 믿음은 개인적인 의견이나 기억 편향 등 신뢰할 수 없는 여러 요인에 의해 크게 영향을 받기 쉽습니다. 그러나 과학적 이론은 경쟁적인 설명이 허위로 밝혀지는 등 많은 연구 결과의 지지를 받고 있으며, 이에 국한되지 않고 종합적으로 증거를 제공합니다. 좋은 이론의 핵심 구성 요소는 경험적으로 실험할 수 있고 잠재적으로 반증할 수 있는 방식으로 기술, 설명 및 예측한다는 것입니다.

An illustration depicting the understanding of the ancient Greeks that the Sun, Moon, and planets all orbited around the earth in perfect circles.
Early theories placed the Earth at the center of the solar system. We now know that the Earth revolves around the sun. [Image: Pearson Scott Foresman, https://goo.gl/W3izMR, Public Domain]

Theories are open to revision if new evidence comes to light that compels reexamination of the accumulated, relevant data. In ancient times, for instance, people thought the Sun traveled around the Earth. This seemed to make sense and fit with many observations. In the 16th century, however, astronomers began systematically charting visible objects in the sky, and, over a 50-year period, with repeated testing, critique, and refinement, they provided evidence for a revised theory: The Earth and other cosmic objects revolve around the Sun. In science, we believe what the best and most data tell us. If better data come along, we must be willing to change our views in accordance with the new evidence.

축적된 관련 데이터를 재검토해야 할 새로운 증거가 발견되면 이론은 수정될 수 있습니다. 예를 들어 고대에 사람들은 태양이 지구를 한 바퀴 돌고 있다고 생각했습니다. 이는 많은 관측 결과와 일치하는 것으로 보였습니다. 그러나 16세기에 천문학자들은 하늘에 보이는 천체를 체계적으로 도표화하기 시작했고, 50년 동안 반복적인 검증과 비판, 개선을 통해 수정된 이론에 대한 증거를 제시했습니다: 지구와 다른 우주 물체는 태양을 중심으로 공전합니다. 과학에서 우리는 가장 좋은, 가장 많은 데이터가 알려주는 것을 믿습니다. 더 나은 데이터가 나오면 새로운 증거에 따라 우리의 견해를 기꺼이 바꿀 수 있어야 합니다.

과학은 객관적인가

Thomas Kuhn (2012), a historian of science, argued that science, as an activity conducted by humans, is a social activity. As such, it is—according to Kuhn—subject to the same psychological influences of all human activities. Specifically, Kuhn suggested that there is no such thing as objective theory or data; all of science is informed by values. Scientists cannot help but let personal/cultural values, experiences, and opinions influence the types of questions they ask and how they make sense of what they find in their research. Kuhn’s argument highlights a distinction between facts (information about the world), and values (beliefs about the way the world is or ought to be). This distinction is an important one, even if it is not always clear.

과학사학자 토마스 쿤(2012)은 과학은 인간이 수행하는 활동으로서 사회적 활동이라고 주장했습니다. 따라서 쿤에 따르면 과학은 모든 인간 활동과 동일한 심리적 영향을 받습니다. 특히 쿤은 객관적인 이론이나 데이터 같은 것은 존재하지 않으며, 모든 과학은 가치관에 의해 영향을 받는다고 주장했습니다. 과학자는 개인적/문화적 가치, 경험, 의견이 질문의 유형과 연구에서 발견한 내용을 이해하는 방식에 영향을 줄 수밖에 없습니다. 쿤의 주장은 사실(세상에 대한 정보)과 가치(세상이 현재 또는 그래야 하는 방식에 대한 신념)를 구분하는 것을 강조합니다. 이 구분은 항상 명확하지는 않더라도 중요한 구분입니다

To illustrate the relationship between facts and values, consider the problem of global warming. A vast accumulation of evidence (facts) substantiates the adverse impact that human activity has on the levels of greenhouse gases in Earth’s atmosphere leading to changing weather patterns. There is also a set of beliefs (values), shared by many people, that influences their choices and behaviors in an attempt to address that impact (e.g., purchasing electric vehicles, recycling, bicycle commuting). Our values—in this case, that Earth as we know it is in danger and should be protected—influence how we engage with facts. People (including scientists) who strongly endorse this value, for example, might be more attentive to research on renewable energy.

사실과 가치 사이의 관계를 설명하기 위해 지구 온난화 문제를 생각해 보세요. 방대한 양의 증거(사실)가 축적되어 인간 활동이 지구 대기 중 온실가스 수준에 악영향을 미쳐 날씨 패턴을 변화시킨다는 사실을 입증하고 있습니다. 또한 많은 사람들이 공유하는 일련의 신념(가치)이 있으며, 이러한 신념은 이러한 영향을 해결하기 위한 선택과 행동(예: 전기 자동차 구매, 재활용, 자전거 통근 등)에 영향을 미칩니다. 우리의 가치관(이 경우에는 우리가 알고 있는 지구가 위험에 처해 있으며 보호되어야 한다는 가치관)은 우리가 사실을 접하는 방식에 영향을 미칩니다. 예를 들어, 이러한 가치를 강력하게 지지하는 사람들(과학자 포함)은 재생 에너지에 대한 연구에 더 많은 관심을 기울일 수 있습니다.

The primary point of this illustration is that (contrary to the image of scientists as outside observers to the facts, gathering them neutrally and without bias from the natural world) all science—especially social sciences like psychology—involves values and interpretation. As a result, science functions best when people with diverse values and backgrounds work collectively to understand complex natural phenomena.

이 예시의 요점은 (자연계의 편견 없이 중립적으로 사실을 수집하는 외부 관찰자라는 과학자의 이미지와는 달리) 모든 과학, 특히 심리학과 같은 사회과학에는 가치와 해석이 포함된다는 것입니다. 따라서 과학은 다양한 가치관과 배경을 가진 사람들이 복잡한 자연 현상을 이해하기 위해 함께 노력할 때 가장 잘 작동합니다.

Four levels of analysis - biological, cognitive, behavioral, social/cultural.

Indeed, science can benefit from multiple perspectives. One approach to achieving this is through levels of analysis. Levels of analysis is the idea that a single phenomenon may be explained at different levels simultaneously. Remember the question concerning cramming for a test versus studying over time? It can be answered at a number of different levels of analysis. At a low level, we might use brain scanning technologies to investigate whether biochemical processes differ between the two study strategies. At a higher level—the level of thinking—we might investigate processes of decision making (what to study) and ability to focus, as they relate to cramming versus spaced practice. At even higher levels, we might be interested in real world behaviors, such as how long people study using each of the strategies. Similarly, we might be interested in how the presence of others influences learning across these two strategies. Levels of analysis suggests that one level is not more correct—or truer—than another; their appropriateness depends on the specifics of the question asked. Ultimately, levels of analysis would suggest that we cannot understand the world around us, including human psychology, by reducing the phenomenon to only the biochemistry of genes and dynamics of neural networks. But, neither can we understand humanity without considering the functions of the human nervous system.

실제로 과학은 다양한 관점을 통해 이점을 얻을 수 있습니다. 이를 달성하기 위한 한 가지 접근 방식은 분석 수준을 이용하는 것입니다. 분석 수준이란 하나의 현상을 여러 수준에서 동시에 설명할 수 있다는 개념입니다. 시험을 위해 벼락치기를 하는 것과 시간을 두고 공부하는 것에 관한 질문을 기억하시나요? 이 질문은 여러 가지 분석 수준에서 답할 수 있습니다. 낮은 수준에서는 뇌 스캔 기술을 사용하여 두 가지 학습 전략 간에 생화학적 과정이 다른지 조사할 수 있습니다. 더 높은 수준, 즉 사고 수준에서는 벼락치기와 틈틈이 연습하는 것과 관련된 의사 결정 과정(무엇을 공부할지)과 집중력을 조사할 수 있습니다. 더 높은 수준에서는 사람들이 각 전략을 사용하여 얼마나 오래 공부하는지와 같은 실제 행동에 관심을 가질 수 있습니다. 마찬가지로, 다른 사람의 존재가 이 두 가지 전략에 걸쳐 학습에 어떤 영향을 미치는지에 대해서도 관심을 가질 수 있습니다. 분석 수준은 한 수준이 다른 수준보다 더 정확하거나 진실한 것은 아니며, 질문의 세부 사항에 따라 적절성이 달라집니다. 궁극적으로 분석 수준은 현상을 유전자의 생화학과 신경망의 역학으로만 환원해서는 인간 심리를 포함한 우리 주변의 세계를 이해할 수 없음을 시사합니다. 하지만 인간 신경계의 기능을 고려하지 않고는 인간을 이해할 수 없습니다.

맥락 속 과학

There are many ways to interpret the world around us. People rely on common sense, personal experience, and faith, in combination and to varying degrees. All of these offer legitimate benefits to navigating one’s culture, and each offers a unique perspective, with specific uses and limitations. Science provides another important way of understanding the world and, while it has many crucial advantages, as with all methods of interpretation, it also has limitations. Understanding the limits of science—including its subjectivity and uncertainty—does not render it useless. Because it is systematic, using testable, reliable data, it can allow us to determine causality and can help us generalize our conclusions. By understanding how scientific conclusions are reached, we are better equipped to use science as a tool of knowledge.  

우리 주변의 세상을 해석하는 방법에는 여러 가지가 있습니다. 사람들은 상식, 개인적 경험, 신앙을 다양한 정도와 조합하여 사용합니다. 이 모든 것은 자신의 문화를 탐색하는 데 나름의 이점을 제공하며, 각각은 특정 용도와 한계가 있는 고유한 관점을 제공합니다. 과학은 세상을 이해하는 또 다른 중요한 방법을 제공하며, 모든 해석 방법과 마찬가지로 많은 중요한 이점을 가지고 있지만 한계도 있습니다. 주관성과 불확실성을 포함한 과학의 한계를 이해한다고 해서 과학이 무용지물이 되는 것은 아닙니다. 과학은 체계적이고 검증 가능하고 신뢰할 수 있는 데이터를 사용하기 때문에 인과관계를 파악할 수 있고 결론을 일반화하는 데 도움이 될 수 있습니다. 과학적 결론에 도달하는 방법을 이해함으로써 우리는 과학을 지식의 도구로 더 잘 활용할 수 있습니다.  


Answer - Test Yourself 1: Can It Be Falsified?

Answer explained: There are 4 hypotheses presented. Basically, the question asks “which of these could be tested and demonstrated to be false?". We can eliminate answers A, B and C. A is a matter of personal opinion. C is a concept for which there are currently no existing measures. B is a little trickier. A person could look at data on wars, assaults, and other forms of violence to draw a conclusion about which period is the most violent. The problem here is that we do not have data for all time periods, and there is no clear guide to which data should be used to address this hypothesis. The best answer is D, because we have the means to view other planets and to determine whether there is water on them (for example, Mars has ice). 

정답을 설명합니다: 4가지 가설이 제시되었습니다. 기본적으로 이 질문은 "이 중 어떤 것이 검증하여 거짓임을 증명할 수 있는가?"를 묻습니다. 답안 A, B, C를 제외할 수 있습니다. A는 개인적인 의견의 문제입니다. C는 현재 기존 측정 방법이 없는 개념입니다. B는 조금 더 까다롭습니다. 전쟁, 폭행 및 기타 형태의 폭력에 대한 데이터를 살펴보고 어느 시기가 가장 폭력적인지 결론을 도출할 수 있습니다. 여기서 문제는 모든 기간에 대한 데이터가 없으며 이 가설을 증명하기 위해 어떤 데이터를 사용해야 하는지에 대한 명확한 가이드가 없다는 것입니다. 가장 좋은 답은 D입니다. 왜냐하면 우리는 다른 행성을 볼 수 있고 행성에 물이 있는지(예를 들어 화성에 얼음이 있는지) 확인할 수 있는 수단이 있기 때문입니다. 

Answer - Test Yourself 2: Inductive or Deductive

Answer explained: This question asks you to consider whether each of 4 examples represents inductive or deductive reasoning. 1) Inductive—it is possible to draw the conclusion—the homeowner left in a hurry—from specific observations such as the stove being on and the door being open. 2) Deductive—starting with a general principle (gravity is associated with mass), we draw a conclusion about the moon having weaker gravity than does the Earth because it has smaller mass. 3) Deductive—starting with a general principle (students do not like to pay for textbooks) it is possible to make a prediction about likely student behavior (they will not purchase textbooks). Note that this is a case of prediction rather than using observations. 4) Deductive—starting with a general principle (students need 100 credits to graduate) it is possible to draw a conclusion about Janine (she cannot graduate because she has fewer than the 100 credits required). 

정답을 설명합니다: 이 문제는 4가지 예시 각각이 귀납적 추론인지 연역적 추론인지 고려하도록 요구합니다. 1) 귀납적 - 스토브가 켜져 있고 문이 열려 있는 것과 같은 구체적인 관찰을 통해 집주인이 서둘러 집을 나갔다는 결론을 도출할 수 있습니다. 2) 연역적 - 일반적인 원리(중력은 질량과 관련이 있음)로부터 시작하여 달은 질량이 작기 때문에 지구보다 중력이 약하다는 결론을 도출합니다. 3) 연역 - 일반적인 원리(학생들은 교과서 비용을 지불하는 것을 좋아하지 않는다)로 시작하여 학생의 행동 가능성(교과서를 구매하지 않을 것이다)에 대한 예측을 할 수 있습니다. 이것은 관찰을 사용하는 것이 아니라 예측을 하는 경우입니다. 4) 연역 - 일반 원칙(학생은 졸업에 100학점이 필요하다)으로 시작하여 제닌에 대한 결론을 도출할 수 있습니다(제닌은 필요한 100학점보다 학점이 적기 때문에 졸업할 수 없다). 

외부 자료

Article: A meta-analysis of research on combating mis-information
http://journals.sagepub.com/doi/full/10.1177/0956797617714579
Article: Fixing the Problem of Liberal Bias in Social Psychology
https://www.scientificamerican.com/article/fixing-the-problem-of-liberal-bias-in-social-psychology/
Article: Flat out science rejection is rare, but motivated rejection of key scientific claims is relatively common.
https://blogs.scientificamerican.com/guest-blog/who-are-you-calling-anti-science/
Article: How Anecdotal Evidence Can Undermine Scientific Results
https://www.scientificamerican.com/article/how-anecdotal-evidence-can-undermine-scientific-results/
Article: How fake news is affecting your memory
http://www.nature.com/news/how-facebook-fake-news-and-friends-are-warping-your-memory-1.21596
Article: New Study Indicates Existence of Eight Conservative Social Psychologists
https://heterodoxacademy.org/2016/01/07/new-study-finds-conservative-social-psychologists/
Article: The Objectivity Thing (or, Why Science Is a Team Sport).
https://blogs.scientificamerican.com/doing-good-science/httpblogsscientificamericancomdoing-good-science20110720the-objectivity-thing-or-why-science-is-a-team-sport/
Article: Thomas Kuhn: the man who changed the way the world looked at science
https://www.theguardian.com/science/2012/aug/19/thomas-kuhn-structure-scientific-revolutions
Video: Karl Popper's Falsification - Karl Popper believed that human knowledge progresses through 'falsification'. A theory or idea shouldn't be described as scientific unless it could, in principle, be proven false.
Video: Karl Popper, Science, and Pseudoscience: Crash Course Philosophy #8
Video: Simple visualization of Type I and Type II errors
Web: An overview and history of the concept of fake news.
https://en.wikipedia.org/wiki/Fake_news
Web: Heterodox Academy - an organization focused on improving "the quality of research and education in universities by increasing viewpoint diversity, mutual understanding, and constructive disagreement".
https://heterodoxacademy.org/
Web: The People's Science - An orgnization dedicated to removing barriers between scientists and society. See examples of how researchers, including psychologists, are sharing their research with students, colleagues and the general public.
http://thepeoplesscience.org/science-topic/human-sciences/

토론 질문

  1. When you think of a “scientist,” what image comes to mind? How is this similar to or different from the image of a scientist described in this module?
  2. What makes the inductive reasoning used in the scientific process different than the inductive reasoning we employ in our daily lives? How do these differences influence our trust in the conclusions?
  3. Why aren’t horoscopes considered scientific?
  4. If science cannot “prove” something, why do you think so many media reports of scientific research use this word? As an educated consumer of research, what kinds of questions should you ask when reading these secondary reports?
  5. In thinking about the application of research in our lives, which is more meaningful: individual research studies and their conclusions or scientific theories? Why?
  6. Although many people believe the conclusions offered by science generally, there is often a resistance to specific scientific conclusions or findings. Why might this be?
  1. 과학자라고 하면 어떤 이미지가 떠오르시나요? 이것이 이 모듈에서 설명하는 과학자의 이미지와 어떻게 비슷하거나 다른가요?
  2. 과학적 과정에 사용되는 귀납적 추론이 우리가 일상 생활에서 사용하는 귀납적 추론과 다른 점은 무엇인가요? 이러한 차이가 결론에 대한 우리의 신뢰에 어떤 영향을 미칩니까?
  3. 운세는 왜 과학적인 것으로 간주되지 않나요?
  4. 과학이 무언가를 "증명"할 수 없다면, 과학 연구에 대한 많은 언론 보도에서 왜 이 단어를 사용한다고 생각하시나요? 교육받은 연구 소비자로서 이러한 2차 보고서를 읽을 때 어떤 종류의 질문을 해야 할까요?
  5. 우리 삶에서 연구의 적용에 대해 생각할 때 개별 연구와 그 결론 또는 과학 이론 중 어느 것이 더 의미가 있습니까? 왜 그럴까요?
  6. 많은 사람들이 일반적으로 과학이 제시하는 결론을 믿지만, 특정 과학적 결론이나 발견에 대해서는 종종 저항감을 갖습니다. 그 이유는 무엇일까요?

Vocabulary

Anecdotal evidence
A piece of biased evidence, usually drawn from personal experience, used to support a conclusion that may or may not be correct.
Causality
In research, the determination that one variable causes—is responsible for—an effect.
Correlation
In statistics, the measure of relatedness of two or more variables.
Data (also called observations)
In research, information systematically collected for analysis and interpretation.
Deductive reasoning
A form of reasoning in which a given premise determines the interpretation of specific observations (e.g., All birds have feathers; since a duck is a bird, it has feathers).
Distribution
In statistics, the relative frequency that a particular value occurs for each possible value of a given variable.
Empirical
Concerned with observation and/or the ability to verify a claim.
Fact
Objective information about the world.
Falsify
In science, the ability of a claim to be tested and—possibly—refuted; a defining feature of science.
Generalize
In research, the degree to which one can extend conclusions drawn from the findings of a study to other groups or situations not included in the study.
Hypothesis
A tentative explanation that is subject to testing.
Induction
To draw general conclusions from specific observations.
Inductive reasoning
A form of reasoning in which a general conclusion is inferred from a set of observations (e.g., noting that “the driver in that car was texting; he just cut me off then ran a red light!” (a specific observation), which leads to the general conclusion that texting while driving is dangerous).
Levels of analysis
In science, there are complementary understandings and explanations of phenomena.
Null-hypothesis significance testing (NHST)
In statistics, a test created to determine the chances that an alternative hypothesis would produce a result as extreme as the one observed if the null hypothesis were actually true.
Objective
Being free of personal bias.
Population
In research, all the people belonging to a particular group (e.g., the population of left handed people).
Probability
A measure of the degree of certainty of the occurrence of an event.
Probability values
In statistics, the established threshold for determining whether a given value occurs by chance.
Pseudoscience
Beliefs or practices that are presented as being scientific, or which are mistaken for being scientific, but which are not scientific (e.g., astrology, the use of celestial bodies to make predictions about human behaviors, and which presents itself as founded in astronomy, the actual scientific study of celestial objects. Astrology is a pseudoscience unable to be falsified, whereas astronomy is a legitimate scientific discipline).
Representative
In research, the degree to which a sample is a typical example of the population from which it is drawn.
Sample
In research, a number of people selected from a population to serve as an example of that population.
Scientific theory
An explanation for observed phenomena that is empirically well-supported, consistent, and fruitful (predictive).
Type I error
In statistics, the error of rejecting the null hypothesis when it is true.
Type II error
In statistics, the error of failing to reject the null hypothesis when it is false.
Value
Belief about the way things should be.

References

  • Kuhn, T. S. (2012). The structure of scientific revolutions: 50th anniversary edition. Chicago, USA: University of Chicago Press.
  • Kuhn, T. S. (2011). Objectivity, value judgment, and theory choice, in T. S. Kuhn (Ed.), The essential tension: Selected studies in scientific tradition and change (pp. 320-339). Chicago: University of Chicago Press. Retrieved from http://ebookcentral.proquest.com

Authors

  • Erin I. Smith
    Erin I. Smith is Associate Professor of Psychology at California Baptist University. She earned her PhD in Developmental Psychology at the University of California, Riverside. She was recently a visiting scholar in science and religion with SCIO (Scholarship and Christianity in Oxford) and currently serves as the director for the Center for the Study of Human Behavior at CBU.

Creative Commons License

Creative CommonsAttributionNon-CommericalShare-AlikeThinking like a Psychological Scientist by Erin I. Smith is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License. Permissions beyond the scope of this license may be available in our Licensing Agreement.

How to cite this Noba module using APA Style

I. Smith, E. (2023). Thinking like a psychological scientist. In R. Biswas-Diener & E. Diener (Eds), Noba textbook series: Psychology. Champaign, IL: DEF publishers. Retrieved from http://noba.to/nt3ysqcm