실험 설계-피셔의 실험 논리

부자관계가 수학사에서 최고라면, 베르누이 가문을 떠올릴 수 있을 것이다. 이 가문은 8 명의 수학자를 양성했고, 그 중 3 명은 세계적인 수학자였다. 통계적으로 옹사위와 로널드 피셔 (1890-1962) 와 조지 벅스 (191) 는 그것들은 모두 실험 설계에서 중요한 통계 최적화 분기이다.

그러나, 아마도 대부분의 사람들은 이러한 중요한 실험 설계 최적화 방법이 세계에서 가장 오래된 농업연구역인 로날드 피셔 (Ronald fisher) 에서 태어났다는 사실에 익숙하지 않을 것이다. 그는' 연구자의 통계 방법',' 실험 설계' 등의 책에서 실험 설계에 대한 정교한 사상을 체계적으로 소개했다.

우연히도 로널드 피셔의 사위 조지 벅스 (George bocks) 도 피셔에게 깊은 통계학적 사고를 심어 실험 설계, 시계열 모델 등에서 큰 성과를 거두며 많은 중요한 문장 및 저서를 발표했다. 그는 통계학과 빅 데이터 업계 종사자들에게 "모든 모델은 틀렸지만 일부는 유용하다" 는 명언을 가지고 있다. Bocks 는 그의 저서에서' 진화 조작-프로세스 개선을 위한 통계 방법',' 실험자 통계 및 경험 모델링 및 응답 표면 방법' 과 같은 실험 설계에 대한 그의 깊은 이해를 체계적으로 소개했다. 한편, ICI 인턴십과 근무한 지 8 년 동안 그는 동료 (화학자 및 화학 엔지니어) 와 함께 실험을 설계하고 분석하여 실험 효율을 높이는 방법을 연구하고 탐구하며 다음과 같은 건의를 했다.

실험 설계는 우선 농업에 적용되어 무 () 생산량을 높인 다음 각 업종의 생산과 R&D 활동 (예: 화학, 의약, 전자, 기계 등) 으로 빠르게 확대된다. 이 과정에서 각 업종의 연구원들은 실제로 실험 설계 방법의 최적화 범주에서 독특한 장점을 점차 인식하고 있다. 이 기사에서는 실험 설계가 필요한 이유에 대해 체계적으로 논의합니다. 실험 설계의 세 가지 원칙, 실험 설계의 작업 흐름, 왜 몇 가지 요소를 테스트해야 합니까? 응답 면 및 순차 실험 전략 및 실험 설계의 응용 시나리오를 간략하게 소개합니다.

첫째, 왜 실험 디자인을 해야 합니까? -면수색이냐, 라인검색이냐?

박크스는 그의 저서' 통계학의 거장인 조지 벅스의 회고록' 에서 "통계학은 어떻게 데이터를 생성하고 사용하여 과학적 문제를 해결할 수 있는지에 관한 것" 이라고 언급했다. (윌리엄 셰익스피어, 통계학, 통계학, 통계학, 통계학, 통계학, 통계학, 통계학) 따라서 과학과 과학적 방법에 익숙해지는 것이 중요하다. 과학기술 연구에서, 우리는 종종 많은 변수를 연구해야 한다. 변경할 수 있는 변수를 "입력 변수" 또는 "요소" 라고 하고 관찰할 수 있는 변수를 "출력 변수" 또는 "응답 변수" 라고 합니다. 한때 사람들은 여러 요인의 영향을 받는 시스템을 연구하는 올바른 방법이 한 번에 한 가지 요인만 바꾸는 것이라고 생각했다. 하지만 일찍이 80 여 년 전, R.A. Fisher 는 이 방법이 비효율적이어서 많은 실험 노력을 낭비했다는 것을 세상에 보여 주었다. 사실, 소위 "실험 설계" 에 따라 여러 가지 요소를 동시에 변경해야합니다. 그러나 지금도 한 번에 한 가지 요인만 바꾸는 방법은 여전히 교실에서 강의하고 있다. \ "을

지금도 일부 연구자들은 한 번에 한 가지 요소를 바꾸는 방법 (비용, 즉 한 번에 하나의 요소를 변경하는 방법, 그에 따라, 실험 설계는 DOE, 즉 실험의 디자인이라고 함) 을 사용하여 최적의 값을 찾는다는 것을 알 수 있다. 그러나 한 번에 한 가지 요인만 바꾸는 방법은 비효율적이고 상호 작용 효과를 평가할 수 없어 최적의 값을 놓치기 쉽다는 단점이 있다.

그림 1 과 같은 사례를 살펴보겠습니다.

한 팀이 연구 결과, 그 회사의 한 제품 화학반응의 수율은 반응부 압력, 촉매제 첨가량과 큰 관계가 있는 것으로 나타났다. 최고의 공예를 탐구하기 위해 다음과 같은 실험을 진행했다.

1) 촉매제 사용량을 5kg 로 고정시키고, 원자로 압력을 여러 번 조정하면, 결국 반응부 압력이 750Mpa 일 때 수율이 가장 좋다는 것을 알 수 있다.

2) 그런 다음 반응부의 압력을 750Mpa 에 고정시키고 촉매제의 첨가량을 여러 번 조정합니다. 마지막으로 촉매제의 첨가량이 3kg 일 때 생산률이 가장 높다는 결론을 내렸다.

3) 이에 따라 과제팀은 반응부압력이 750Mpa 이고 촉매제 사용량이 3kg 일 때 총 수율이 가장 좋다고 판단했다.

그럼, 사실은 이 팀이 내린 결론과 같은가요? 오른쪽 실험 설계의 아이소라인도에서 볼 수 있듯이, 가장 좋은 장점은 실제로 반응부압력 =650Mpa, 촉매제 첨가량이 3 kg 일 때 9 1% 보다 높은 수율을 얻을 수 있으며, 첫 번째 방법의 최적 수율은 약 90% 로 추산됩니다. 따라서 첫 번째 방법은 확실히 최적의 가치를 놓칠 위험이 있다. 사실, 위의 그림에서 볼 수 있듯이, 첫 번째 방법은 실제로 라인 검색의 한 방법이며, 실험 설계는 면 검색의 한 방법입니다. 분명히 면별 검색은 선별 검색보다 효율적이며 최적의 값을 쉽게 캡처할 수 있습니다. 동시에, 실험 설계 방법을 통해 매우 직관적인 응답 변수와 요소 사이의 응답 표면 및 아이소라인 다이어그램을 얻을 수 있으므로 응답 변수가 요인에 따라 변하는 법칙을 더 잘 이해할 수 있습니다.

둘째, 실험 설계의 세 가지 원칙? -피셔의 농지

위의 첫 번째 섹션을 통해, 우리는 왜 DOE 가 원가법보다 더 효율적인지 이해하지만, 어떻게 실험을 설계하는 것은 매우 중요한 부분이며, 실험의 효율성과 성공에 직접적인 영향을 미칠 수 있다. 피셔는 로잔 농업실험소에서 일하는14 (1919-1933) 기간 동안 실험 설계 보편성의 세 가지 원칙을 요약했다.

(1) 테스트를 반복합니다.

(2) 무작위 화;

(3) 지역화.

그러나, 때때로, 이 세 가지 원리는 일부 전문 서적에서 매우 난해하게 해석된다. 여기서 우리는 날조한 이야기, 즉 어부의 농지를 통해 이 세 가지 원리를 다른 각도에서 해석하려고 노력한다.

그림 2 에서 볼 수 있듯이 피셔가 로잔 농업실험소에서 일할 때 두 가지 벼 씨앗의 무당 생산량 평가 실험을 한 적이 있다. 심사숙고한 끝에 그는 결국 실험 설계의 세 가지 원칙을 제시하여 학계에서 고전으로 추앙받았다.

첫째, 피셔의 생각은 벼종 A 와 벼종 B 를 각각 두 개의 논에 심고, 어느 벼종의 무당 생산량이 더 높은지 보고 평가 결론을 내리는 것이다. (알버트 아인슈타인, Northern Exposure (미국 TV 드라마), 벼명언)

(2) 하지만 피셔는 큰 통계학자였기 때문에 조금 더 생각해 본 후, 한 점으로만 판단하는 것은 엄밀하지 않다고 생각했다. 그래서 그는 좌우 두 밭을 네 조각으로 나누고 A 와 B 를 심어서 벼씨 A 와 B 의 평균 무당 생산량뿐만 아니라 그들의 무당 생산량 표준편차도 얻을 수 있게 하여 더욱 설득력이 있다. (윌리엄 셰익스피어, Northern Exposure (미국 TV 드라마), Northern Exposure (미국 TV 드라마), 성공명언

(3) 하지만 예민한 피셔는 앞서 언급한 테스트 방법이 여전히 결함이 있다는 것을 곧 깨달았다. 농업실험소에서 다년간의 근무 경험에 따르면 왼쪽의 농경지 토양이 보통이고 오른쪽의 농경지 토양이 비옥하다면 실험소의 농경지 비옥도가 고르지 않기 때문이다. (윌리엄 셰익스피어, Northern Exposure (미국 TV 드라마), Northern Exposure (미국 TV 드라마), 농업명언 만약 최종 결론이 벼씨 B 의 생산량이 더 높다는 것이라면, 벼씨인가, 아니면 토양이 높은 생산량을 초래하는가? 이 두 요소 사이에 혼동이 있어서, 사고를 거쳐 그는 실험 방법을 다시 설계했다. 그는 A 와 B 를 각각 왼쪽과 오른쪽 농지에 심어 A 와 B 의 벼를 비옥한 토양과 일반 농지에서 균등하게 재배함으로써 결과가 더욱 합리적이다.

(4) 원래 실험 프로그램은 직접 조작 할 수 있습니다. 이때 농업실험소는 새로 발명한 기계파종기가 인공파종보다 무당 생산량을 높이는 데 더 도움이 되는지 평가할 것을 요구하는 새로운 임무를 임시로 받았다. 실험 횟수를 줄이려면 두 가지 평가를 결합해야 한다. 피셔는 천재였고, 그는 곧 이 문제를 해결할 완벽한 방법을 찾았다. 그는 좌우 농지의 절반에 인공파종을 하고, 나머지 절반은 기계로 파종하여 실험 횟수를 늘리지 않고 파종했다.

실제로 피셔는 앞서 언급한 실험 논리 사고 ② ③ ④ 중 창조적으로 반복 실험, 무작위화, 지구실화의 세 가지 실험 설계 원칙을 두 벼무 생산량의 평가 임무에 적용함으로써 실험 결과의 유효성과 합리성을 보장하고 최종 과학적 평가 결과를 강력하게 보장했다.

물론 그룹화에는 "그룹화할 수 있는 그룹, 그룹화할 수 없는 무작위화" 라는 기본 원칙이 있습니다. " \ "을

셋. 실험 설계 및 분석 워크 플로우

우리는 이미 실험 설계의 장점과 세 가지 원칙을 알고 있다. 여기서는 전체 분석 설계 및 모든 요소를 통해 작업 흐름의 실험 설계 및 분석을 소개했습니다.

그림 3 에서 볼 수 있듯이 이것은 일반적인 요소 설계 다이어그램입니다. 그림에서 볼 수 있듯이 실험 설계자는 A, B, C 의 세 가지 요소가 반응 변수에 미치는 영향을 연구하려고 합니다. 따라서 디자이너는 다음과 같은 실험 방안을 설계하여 위의 실험을 통해 다음과 같은 회귀 방정식의 계수를 추정하고자 합니다.

위의 회귀 방정식에서 분명히 알 수 있듯이 * * * 마찬가지로, 계수 수가 N 이면, 우리는 완전 인수 분해를 실현해야 하며, 적어도 시착해야 한다.

앞서 언급한 테스트 설계의 세 가지 원칙에 따라 반복 테스트가 필요하지만 테스트 횟수를 줄이기 위해 일반적으로 중심점에서 3 ~ 4 회 반복 테스트를 선택합니다. 반복 테스트를 위해 중심점을 선택하는 또 다른 이점은 모형에 굽힘 현상이 있는지 확인할 수 있다는 것입니다. 구부리기 현상이 있는 경우 계수의 상위 항목을 추가하여 응답면을 형성해야 합니다. 일반적으로 말하자면, 우리는 기본적으로 최적의 값을 찾았다는 것을 의미한다. 물론 구부리기의 경우 나중에 설명할 모형 매개변수를 추정하기 위해 몇 가지 테스트 점을 추가해야 합니다. 동시에 테스트 순서를 무작위화해야 합니다. 이 경우 지역화 요구 사항이 없으므로 이 테스트 설계에 따라 직접 테스트하여 해당 테스트 데이터를 얻을 수 있습니다.

또한 계수의 높낮이를 설정할 때는 높낮이를 최대한 설정해야 합니다. 그렇지 않으면 실험의 소음이 기존의 현저한 효과를 압도할 수 있습니다. 또한 그림 4 와 같이 테스트 지점을 멀리 설정하면 알 수 없는 프로세스 위치를 탐색하는 데도 도움이 됩니다.

테스트 데이터를 얻은 후에는 테스트 설계 분석을 시작해야 하며 기본적으로 다음 프로세스를 따릅니다.

실제로 위의 작업 흐름에서 처음 세 단계는 단항 선형 회귀에 자세히 설명되어 있습니다. 약간 다른 점은 이 회귀 모델에서 계수 (주요 효과) 의 수가 1 보다 크고 2 차 상호 작용이 있다는 것입니다. 따라서 회귀 계수를 검사하여 응답 변수에 미치는 영향이 현저하고 모형이 구부러지거나 일치하지 않는지 확인해야 합니다.

개선된 모델에 이상이 없을 경우 모델 해석 단계로 들어갈 수 있습니다. 이 단계에서 우리는 두 가지 일을 해야 합니다.

(1) 출력 요소의 주요 효과 다이어그램과 상호 작용 다이어그램을 통해 중요도를 더욱 검증하고 확인합니다.

(2) 아이소라인 다이어그램과 응답 면을 출력하면 인수에 따라 응답 변수가 변하는 법칙을 보다 직관적으로 이해할 수 있어 최적의 설정을 찾는 데 도움이 됩니다.

다음으로 응답 최적기를 통해 최적의 설정을 찾아 최적의 값이 원래 목표에 도달했는지 확인해야 합니다. 만약 있다면, 일이 끝나는 것은 아니지만, 우리는 더 많은 검증 실험을 해야 한다. 통상적인 방법은 가장 좋은 점에서 세 번 이상 검증 실험을 하는 것이다. 물론, 원래의 목표를 달성하지 못한다면, 우리는 예정된 목표에 도달할 때까지 계속해서 가장 좋은 점을 중심으로 실험 설계를 준비해야 한다.

4. 왜 몇 가지 요소를 테스트해야 합니까? -해상도와 테스트 효율성 간의 균형

앞서 언급했듯이 계수 수가 N 일 때, 전체 원인 설계를 해야 한다면 적어도 한 번은 실험을 해야 한다. 우리는 간단한 계산을 통해 얻을 수 있다. 계수 수가 5 에 도달하면 전체 분석인 설계에는 32 회의 실험 (중심점 제외) 이 필요하고 계수 수가 6 에 도달하면 전체 분석인 설계에는 64 회의 실험이 필요합니다. 네 가지 요소를 예로 들자면, 실험 설계의 모형 방정식은 다음과 같습니다.

우리가 완전한 요인 설계를 한다면 상수항 외에 4 개의 추정 주효과, 6 개의 2 차 상호 작용, 4 개의 3 차 상호 작용, ***4 개의 4 차 상호 작용, *** 1 및/Kloc-0 이 있습니다 우리가 정말로 추론해야 할 매개변수는 상수항, 주효과 항목, 2 차 상호 작용 항목, * * 는 1 1 입니다. 실험을 적게 하고 모형 방정식의 상수, 1 차, 2 차 계수에 대한 생각을 알 수 있습니다.

실제 업무에서는 자원 및 시간 제약으로 인해 효율성 및 테스트 비용 관리에 대한 이러한 수요가 널리 퍼져 있습니다. 아니면 네 가지 요소 (A, B, C, D) 를 예로 들자면, 완전히 분석적으로 16 번의 실험이 필요한데, 이때 제약에 따라 8 번의 실험만 할 수 있다면, 이 8 번의 실험이 어떻게 가장 합리적일까요? 분석에 따르면, 발생기 D=ABC (ABCD= 1, 약어로' word' 로 정의됨) 에 따라 실험을 선택하는 것이 가장 합리적이며, 실험 설계의 직교성을 보장할 수 있을 뿐만 아니라 1 차 주 효과와 2 차 상호 작용이 혼합되지 않도록 보장할 수 있다는 결론을 내릴 수 있다.

일부 인자 실험에도 많은 생성기 (즉, 많은 단어) 가 있다. 이때 모든 단어 중 가장 짧은 단어의 길이는 전체 디자인의 해상도로 정의되며, 일반적으로 I, II, III, IV 등과 같은 로마 숫자로 제공됩니다. 위 예에서 8 개의 실험은 ABCD= 1 으로 배열되어 있으며 해상도는 IV 입니다. 이 설계는 일반적으로 해상도가 R 인 일부 요소 설계를 기록합니다. 여기서 K 는 계수 수, P 는 생수 또는 글자 수입니다.

연구자의 편의를 위해 통계학자들은 표 2 의 일부 요소 검사에 대한 분별표를 전문적으로 편성했다. 동시에, minitab 또는 jmp 소프트웨어에서 일부 요소 실험의 설계는 소프트웨어에 의해 직접 생성될 수 있습니다.

위 표에서 알 수 있듯이 계수 수가 결정된 경우 더 높은 해상도를 얻을 필요가 있으므로 더 많은 실험을 해야 합니다. 따라서 실제 업무에서 연구원들은 해상도와 효율성의 균형을 맞추기 위해 필요에 따라 선택할 수 있습니다.

5. 굽힘 응답 표면 방법 및 순차 시험 전략 선택

응답 표면 방법 (RSM) 은 일반적으로 다음과 같은 경우에 적용됩니다.

(1) 계수 수가 적습니다 (일반적으로 3 개 이하).

(2) 응답 변수의 최대값 또는 최소값을 찾아야 합니다.

실험 설계에서 응답 표면 방법은 일반적으로 필터 요소 후 전체 요소 실험에서 구부리기 현상이 발생하는 경우가 많습니다. 이때 취해야 할 전략은 모델에 2 차 항목이 있는 회귀 방정식을 추가하는 것이다. 레벨 2 의 경우 일반 모델은 다음과 같이 표현할 수 있습니다.

이 시점에서 추정할 매개변수가 두 개 (계수 제곱 항목의 계수) 를 더하면 원래 테스트 포인트가 충분하지 않고 일부 테스트 포인트를 추가한 다음 선형 회귀를 통해 관련 매개변수를 추정해야 합니다. 이때 가장 효과적인 방법은 순차 테스트 전략을 사용하여 테스트 포인트를 늘리는 것입니다. 그림 6 은 순서를 유지하는 두 가지 중심 복합 설계 방법을 보여 줍니다. 물론 응답 표면 설계에는 다른 방법이 있지만 중앙 복합 경계 설계 (CCI) 및 Box-Behnken 설계와 같은 질서 있는 특성은 유지되지 않습니다.

테스트 포인트를 추가하면 응답 표면 분석을 수행할 수 있습니다. 분석 프로세스는 위의 실험 설계 분석 프로세스와 거의 유사하며 여기서는 자세히 설명하지 않습니다.

자동동사 실험 설계는 공업 분야의 응용 시나리오를 소개한다.

실험 설계는 효율적인 최적화 도구로서 이미 각 업종, 특히 화공 산업에 광범위하게 적용되었다. 과학 연구원들은 실험 설계 방법을 통해 제품 배합 설계 개발 효율성, 생산 효율성 및 제품 수율을 높였다. 또한 실험 설계를 통해 제품 신뢰성과 프로세스 견고성을 높임으로써 많은 업계에서 큰 성공을 거두었습니다.

통계적 사고와 연구자의 전문지식과 경험 (비통계 지식) 은 실험의 성공에 매우 중요하다. 하지만 탐구적인 연구를 할 때 축적된 지식과 경험이 부족해 평가할 요소가 갑자기 늘어난다. 앞의 논의에서 알 수 있듯이 계수 수가 증가하면 완전히 인인 디자인의 실험 횟수는 기하급수적으로 증가하며, 일부 요인을 테스트한 경우에도 실험 횟수는 여전히 크다. 따라서 기업에게는 R&D 비용 부담이 커지고 R&D 효율성에 영향을 미칠 수 있습니다. 중국 만화연구원과의 협력 프로젝트에서 국공 지능의 데이터 과학 전문가는 베이시안 최적화 알고리즘을 통해 원래 150 번의 시범이 필요했던 최적화 작업을 3 라운드 *** 15 번의 시범으로 줄여 같은 효과를 거두었다. 그러나 실험 설계법이 기계 학습 알고리즘보다 더 설명적이라는 것은 부인할 수 없다. 이것은 연구원들이 그 메커니즘을 더 연구하는 데 매우 중요하다. 동시에 인공 지능 알고리즘에서도 추가 최적화 및 실험 준비를 위해 이전 실험 설계에서 얻은 데이터 포인트에 대한 지원이 필요합니다.

전반적으로 실험 설계는 여전히 화공 의약 등 분야에서 가장 중요한 최적화 도구이다. 화학 및 제약 분야의 인공 지능 의사 결정 제어 분야의 리더로서 SINIC 은 다양한 통계 모델 알고리즘의 개발과 응용을 중시해 왔습니다. 현재 데이터 뇌 플랫폼은 수백 가지의 통계와 기계 학습 알고리즘을 통합하여 화학과 의약업에 광범위하게 적용해 국내 수많은 기업에 막대한 상업적 가치를 창출하고 있다.

참고 자료:

[1]. 통계학, [미] 윌리엄 M 멘덴 홀 등.

[2]. 경험의 설계 및 분석.

[3]. "통계학 마스터의 길-조지 벅스 회고록", 저자] 조지 E.P. 벅스.

[4]. "6 가지 관리 통계 가이드", 말을 기다리고 있습니다.

[5] ..? 실험 설계 소개.