Графични изображения в Excel и анализ на данни
I. Графични изображения в MS Excel
Чрез графични изображения (ГИ) в Ексел се дава възможност да се види обемът на дадено явление, неговата структура, развитието му или пространственото му разпределение. Основни елементи на графичните изображения са: заглавие, мащаб, скали, легенди, съдържание. ГИ се делят на линейни, плоскостни (равнинни) и пространствени (3-D). Всеки ред или колона от избрана област описва серия данни (Data Series). Поредицата от наименования и поредицата от стойности се разполагат по ос X- за категориите и по ос Y- за стойностите.
Линейната диаграма (Line) се използва за представяне на зависимостта между две променливи y=f(x) или развитието на една величина във времето y=f(t). В първия случай на абсцисната ос се представя незавимата променлива x, а на ординатната ос- зависимата променлива y, а във втория случай- времето t. Равнинната (плосткостна) диаграма се построява чрез използване на различни видове геометрични фигури- правоъгълници, квадрати, триъгълници, кръгове и др. Правоъгълниците могат и да бъдат разделяни на части в зависимост от съответните дялове на количествата (коминообразни или правоъгълни диаграми от компоненти) или да бъдат обединявани в подходящи съотнощения (съставни правоъгълни диаграми). Стълбовидната диаграма (Column) се използва за сравняване на отделни серии данни. Правоъгълниците, подредени един до друг или един върху друг спрямо оси Х или Y дават възможност за сравнения на разлчини величини в 1 период от време. Съставната диаграма (Area) е удобна за едновременно представяне промените за даден период и пропорционални съотношения. Диаграмите XY Scatter, наречени разсеяни диаграми, представят дискретни точки, без да се показват връзки между тях. Радарната диаграма (Radar) се използва за показване на връзките между различни серии данни. Кръговата диаграма (Pie) се използва при илюстриране на проценти, прпорции или съотношения в дадено цяло. Кръгът се разделя на сегменти (от 3 до 8), пропорционални на размера на частите, които те представляват. Изобразява само една серия данни. При онагледяването на няколко серии данни се използва концентрична диаграма тип (Doughnut), състояща се от концентрично разположени пръстени за всяка серия.
1. Построяване на диаграма в MS Excel
Маркира се област от таблицата. Активира се командата Insert/ Chart… или се избира бутон Chart Wizard… Управлението се поема от помощната програма Chart Wizard , чрез която се описват елементите на диаграмата. В прозорец Chart Wizard – Step 1 of 4- Chart Type- в зависимост от характера на данните се избира един от единадесетте основни типа диаграми и подходящ подтип (Chart sub- type). За всеки тип диаграма се предлага характерен за нея набор от подтипове. В прозорец Chart Wizard – Step 2 of 4- Chart Source Data- се определя областта, източник на данни.
Data Range: = Sheet1! $A$1:$B$6 и разполагането на сериите данни – по редове или по колони Series in: ¤ Columns (респективно ¤ Rows)
За да се извеждат надписи на координатите по оста Х и на легенда, е необходимо да се маркира реда с наименованията на колоните и на редовете (Heading Column и Heading Row). В полето Data Range: е възможно да се въведе нова област или да се маркира нова област. В прозорец Chart Wizard – Step 3 of 4- Chart Options- се определят следните елементи на диаграмата: надписи на диаграмата и на осите Titles; надписи на осите Axes; мрежа Gridlines (разграфяване по оста Y – Value [Y] и/ или по оста X – Category [X] Axis, което може да се извърши с широка стъпка – Major Gridlines или с малка стъпка- Minor Gridlines; легенда Legend; Data Labels; Data Table. Проектирането завършва с четвърта стъпка Chart Wizard – Step 4 of 4- Chart Location. Посочва се, че създадената диаграма ще се изведе като обект в работен лист ¤As object in: Sheet1 или се създава нов работен лист ¤As new sheet: Chart2
2. Редактиране на диаграма
Нова серия данни се вмъква с бутон Chart Wizard… В прозорец Chart Wizard – Step 2 of 4- Chart Source Data- се определя областта, източник на данни, като се добавя “;” и адресът на новата област във формат SheetN!нова област
За да се отстрани серия данни от диаграмата, тя се маркира и се изтрива с Del.
3. Форматиране на диаграма
За всяка създадена диаграма се прилагат стандартни форматиращи параметри за тип на диаграмата, площ, серия данни, област на чертане, символи на надписите, оси. Промяната на форматиращите параметри става чрез Format / Selected <елемент>
Например за да се преформатира серия данни, тя се маркира и се активира командата Format/ Selected data series… Предлагат се възможности за форматиране на Pattern, Axis, Y Error Bars, Data Labels, Series Order, Options.
4. Промяна типа на диаграмата
От контексното меню се избира Chart Type… и се посочва нов тип диаграма.
При пространствените диаграми 3D чрез командата 3-D View, избрана от контексното меню, се задава перспектива, хоризонт, от който да се разгледат данните, въртене около оста Z, изключване на перспективата, височина на диаграмата, автоматично преобразуване на скалите.
| A | B | C | D | E | A | B | C | D | E | ||
| 1 | Месеци | 8 ч. | 10.3 ч. | 13.3 ч. | 16 ч. | 7 | Юни | 0.00472 | 0.00361 | 0.00424 | 0.00453 |
| 2 | Януари | 0.09946 | 0.08594 | 0.08973 | 0.07600 | 8 | Юли | 0.00229 | 0.00236 | 0.00473 | 0.00273 |
| 3 | Февруари | 0.11820 | 0.09945 | 0.08855 | 0.06709 | 9 | Август | 0.00657 | 0.00647 | 0.00507 | 0.00493 |
| 4 | Март | 0.03893 | 0.04947 | 0.04521 | 0.04050 | 10 | Септемвр | 0.01133 | 0.00731 | 0.01523 | 0.01000 |
| 5 | Април | 0.03232 | 0.03500 | 0.02684 | 0.02026 | 11 | Октомври | 0.00694 | 0.00300 | 0.00457 | 0.00360 |
| 6 | Май | 0.00688 | 0.00665 | 0.00724 | 0.00678 | 12 | Ноември | 0.01942 | 0.02035 | 0.03135 | 0.02900 |
Задача 1.
Заредете файла ANALIZ.XLS . Електронната таблица съдържа информация за средните концентрации на серен диоксид, измерени в 8 ч., 10.30 ч., 13.30 ч. и 16 ч. през цялата 2004 година.
В същия работен лист създайте диаграма, онагледяваща четирите серии данни (по колони) от тип Column за 8 ч., 10.30 ч., 13.30 ч., 16 ч. Маркирайте областта A1:E13. За да се извеждат надписи на координатите по оста Х и легенда, се маркират и наименованията на колоните. Активирайте командата Insert /Chart… В прозорец Chart Wizard – Step 1 of 4- Chart Type- изберете тип на диаграмата Column и подходящ подтип (Chart sub- type- Clustered Column), който сравнява стойностите по категории. В прозорец Chart Wizard – Step 2 of 4- Chart Source Data- автоматично е определена областта, източник на данни Data Range: = Sheet1! $A$1:$E$13 , както и че сериите данни са разположени по колони Series in: ¤ Columns. В прозорец Chart Wizard – Step 3 of 4- Chart Options- определeте следните елементи на диаграмата:
a) надписи на диаграмата и на осите Titles
Chart Title: Годишно сравнение на концентрацията на серен диоксид за гр. Бургас
Category (X) axis: 2004 година
Category (Y) axis: средна концентрация
б) Изберете и след това отменете надписите на осите Axes
Primary Axis Category (X) axis Value (Y) axis
в) Изберете и отменете показване на мрежата Gridlines (разграфяване по оста Y – Value (Y) и/ или по оста X – Category (X) axis- Major gridlines или Minor gridlines, което може да се извърши с широка или с малка стъпка
г) Изберете и отменете показване на легенда Legend : Show legend. Изпробвайте раличните начини на разполагането в диаграмата на легендата Placement ¤ Right (отдясно) и др.
д) В прозореца Data Labels изпробвайте възможностите за Label Contains Series contains, Category name или Value
е) В прозореца Data Table изпробвайте възможностите Show data table (към диаграмата да се показва и таблицата с данни) и Show legend keys при включена таблица с данни..
ж) Посочете в четвърта стъпка, че създадената диаграма ще се изведе като обект в Sheet1 ¤As object in: Sheet1 (в случая активния работен лист e Sheet1).
з) Създайте нова стълбовидна диаграма (тип Column) в Sheet1, която да представи и сравни изменението на концентрацията на SO2 в 10.30 ч. и в 16 ч. в същия работен лист Sheet1. Осветeте А1:А13, задръжте се Ctrl , маркирайте несъседните области C1:C13 и Е1:E13 (сериите данни са по колони). С бутон Chart Wizard… се активира помощната програма за създаване на диаграма.
Задача 2.
а) Отстранете от диаграмата, описана в точка “ж” серия данни за 13.30 ч. Маркирайте серията данни за 13.30 ч. и използвайте клавиша Del. По същия начин отсранете сериите данни за 8 ч. и 16 ч. Маркирайте последната останала серия данни и от контексното меню изберете Source Data… Проверете коя област с данни е показана в Data Range. Data Range: = ’Sheet1’! $A$1:$A$13;’Sheet1’!$C$1:$C$13
б) Добавете нови серии към активната диаграма като в прозорец Source Data/ Data range добавите ;Sheet1!$B$1:$B$13 или директно като маркирате от таблицата серия данни A1:E13.
в) Променете типа на диаграмата в тип Bar като от контексното меню изберете Chart Type… Посочете тип на графиката Bar, подтип Stacked bar. По оста (Y) са изведени стойностите за концентациите, а по оста (X) -месеците. Преминете отново към тип Column, подтип Clustered Column.
Задача 3.
а) Създайте нова диаграма, която да представи чрез линейна функция (тип Line) изменението на концентрацията на SO2 в 8 ч. Осветете област B1:B13. Тъй като не е маркирана област A1:A13, не се извеждат надписи по оста (X). Поставете легенда над диаграмата, подходящи надписи на диаграмата и на осите. Новата диаграма изведете в отделен работен лист ¤As new sheet: Chart1
Създава се нов работен лист Chart1, отляво на активния работен лист Sheet1.
б) От контексното меню изберете Format Plot Area… Прозорец Patterns съдържа две части: Border, в която част се задават параметри на рамката Style, Color, Weight и Area, в която се уточняват параметрите за фона. Изберете с Fill Effects прозорец Gradient, задайте фона да е съставен от два цвята ¤Two colors, изберете тези цветове и стила на сянката Shading styles като ¤Diagonal up.
в) Променете типа на диаграмата като след като сте маркирали серията данни, от контексното меню изберете Chart Type… и от тип Column посочете Clustered column with a 3-D visual effect. От контексното меню на площта на диаграмата изберете 3-D View…, за да разгледате възможностите да се задава перспектива, хоризонт от който да се разгледат данните, въртене около оста Z, изключване на перспективата, височина на диаграмата, автоматично преобразуване на скалите.
| А | B | C | D | E | |
| 1 | 2000 г. | 2002 г. | 2003 г. | 2004 г. | |
| 2 | Студенти 1 курс | 100 | 150 | 180 | 200 |
| 3 | Студенти 2 курс | 75 | 100 | 110 | 130 |
| 4 | Студенти 3 курс | 50 | 95 | 100 | 120 |
| 5 | Студенти 4 курс | 22 | 80 | 90 | 100 |
| 6 | Магистри | 30 | 30 | 25 | 35 |
| 7 | Докторанти | 10 | 13 | 15 | 20 |
Задача 4.
а) Заредете файла STUDENTI.XLS. В същия работен лист създайте кръговата диаграма (Pie) за разпреление на студентите през 2004 г. Oт шестте подтипа изберете този, който най-добре онагледява данните. Подходящо ли е в случая серията данни да е по редове? Задайте надпис на диграмата Titles, легенда Legend и Data Labels- Label Contains Percentage.
б) Сменете типа на диаграмата на линейна. Маркирайте диаграмата и променете областта данни на A1:E7 като актвирате командата Chart/ Add Data… Преформатирайте всички елементи на диаграмата. Изтрийте диаграмата като я маркирате и от контексното меню изберете Clear. Отменете това действие с Edit/ Undo.
в) Променете размерите на диаграмата като я маркирате. Поставете маркера върху рамката на диаграмата. Той се изменя в ó и с влачене на мишката настройте размерите й.
г) Изберете оста (X) като щракнете върху нея и тя се маркира с n—–n. Активирайте командата Format/ Selected Axis или от контексното меню Format Axis…. Изпробвайте възможностите на командите Patterns, Scale, Font, Number и Alignment. От прозореца Scale изберете стойностите по оста (Y) да се извеждат отдясно.
Изберете оста (Y) и от прозорец Scale посочете Value (Y) axis scale да се променя с Logaritmic scale, пресичането с оста (X) да става при 10 Cross at 10 .
II. Графични средства за анализ
Освен за доброто възприемане и осмисляне на табличните данни графичното представяне е средство за анализ. Към диаграмата е възможно да се добави линия на тенденцията (ЛТ, регресионна линия ) и индикатори на грешка (ИГ).
ЛТ се генерира така, че в съответните стойности по абсцисата отклоненията на функцията да бъдат минимални. Всяка промяна в изходните данни води до актуализиране на ЛТ. ЛТ се добавя към следните видове диграми: bar, column, line, XY- scatter. Не се добавя ЛТ към следните видове диаграми: пространствени 3D, радарни radar, кръгова pie, концентрични doughnut.
1. Създаване на ЛТ
1.Избира се серията данни, за която ще се построи ЛТ; 2.Активира се Chart /Add Trendline… или от контексното меню се избира Add Trendline… В прозорец Type се определя тип и параметрите на регресионната линия:
| Вид на функцията | Regression Type | Уравнение |
| Линейна | Linear | Y=mx+b |
| Логаритмична | Logarithmic | Y=c*ln(x)+b |
| Полином | Polynomial | Y=b+c1x+c2x2+…+c6x6 |
| Потенциална | Power | Y=c.xb |
| Експоненциална | Exponential | Y=c.ebx |
| Подвижна средна стойност | Moving Average |
В прозореца Options се дефинира наименование на линията на тенденцията Trendline Name. По подразбиране с Automatic се дефинира името, съответстващо на вида на ЛТ (Linear, Logarithmic, Polynomial, Power и.т.н.). Възможно е потребителят да дефинира име на ЛТ ¤ Custom . Избира се дали да се изведе на диаграмата уравнението, описващо линията на тенденцията Display equaton on chart и/ или квадратичната стойност Display R-squared value on chart. Посочва се долната граница на стойностите по оста y (Intercept) . Ако не се зададе, тя се изчислява автоматично въз основа на данните Set intercept = 0. ЛТ може да се използва за предсказване Forecast поведението на серията данни напред във времето Forward или за минали периоди Backward като се зададе желания брой периоди.
2. Форматиране на ЛТ в Microsoft Excel
1. Избира се ЛТ; 2.Активира се Format/Selected Trendline или от контексното меню се избира Format Trendline…. Настройват се параметрите в Patterns, Type и Options. В първия отворен прозорец се променя стила на линията, цвят, дебелина на ЛТ.
3. Изтриване на ЛТ в Microsoft Excel
Всеки път линията на тенденцията може да се изтрива като се маркира и се натисне клавиш Del или се активира Edti/ Clear/ Trendline.
4. Добавяне и отмяна на индикатор на грешка към серия данни
Маркира се серия данни и се активира Format/Selected DataSeries или от контексното меню се избира Format DataSeries …, прозорец Y Error Bars. Индикаторът на грешка се изтрива е None.
Задача 5.
Към диаграмата, създадена въз основа на данните в таблица ANALIZ.XLS, генерирайте линия на тенденцията. Маркирайте серията данни $B$1:$B$13. Всяка точка от диаграмата се отбелязва с n. Избирете Chart/Add Trendline…. Посочете Regression Type: Linear. През данните се чертае права линия y=mx+b. Повторете тази стъпка като изберете другите видове функции: Logarithmic, Polynomial, Power, Exponential, Moving Average (с подвижна средна стойност: при което се изчислява средна стойност от елементите на серията данни и оттам се извежда тенденцията). Изберете Regression/ Type: Logarithmic и сменете типа на Polynomial (полином от 4- та степен).
Задача 6.
а) Щракнете двукратно върху линията на тенденцията (или се избира Format/Selected Trendline…). В полето Options посочете Trendline Name ¤ Automatic- стандартно име , но може да се избере и ¤ Custom, с което да се зададе име на линията на тенденцията от потребителя. В полето Forecast въведете колко периода в бъдещето ще се прогнозират Forward: 3 Periods. Изберете Display equation on chart, за да може да се вижда в диаграмата и уравнението на функцията, по която се чертае линията на тенденцията.
б) Изберете Display R- squared value on chart, за да се изведе R2 в диаграмата. Стойност на R2 , близка до 1, показва, че типа на линията на тенденцията е подходящо избрана.
в) Изберете другите видове функции: Logarithmic, Polynomial, Power, Exponential. За всяка от тях повторете т. 2, за да откриете най- подходящата линия на тенденцията (R2 , близка до 1). След сравняване на стойностите за R2 се установява, че логаритмичната функция дава най- добро приближение и в следващите 3 месеца се очаква намаление на концентрацията.
Задача 7.
Маркирайте серия данни $B$1:$B$13 и активирайте Format/ Selected Data Series…, прозорец Y Error Bars. Изберете начин на извеждане Both и количество на грешката: Error Amount: ¤ Percentage 2%. Изтрийте индикатор на грешка с None.
Задача 8 -(по избор)
Създайте аналогични диаграми от тип Area за средната концентрация в 10.30 ч., 13.30 ч. и 16 ч. Кой тип функция на ЛТ описва най- добре всяка от сериите данни? Какви са прогнозите за следващите шест месеца за различните серии данни?
Сходни статии:
- Решаване на задачи с Excel В таблица се съхранява информация за кандидат – студенти, която включва: входящ номер, успех от конкурс1, успех от конкурс2, успех от конкурс3, име, фамилия, успех от дисциплина1, успех от дисциплина2,...
- Анализ на образователни уеб сайтове автор: И. Цветански http://www.technologystudent.com 1 Сайт : В този уеб сайт могат да се използват повечето от показаните в сайта програми и структорни форми. Много от тях липсват в българското...
- Инженерен анализ на електрически сноп проводници ГФ на снопа е осъществяване обемен монтаж на електрически и електронни устройства. Oсновни функции: F1 -осъществяване на връзка между устройства F2 -провеждане на ел. енергия F3 – защита F4 –...
- База данни в Delphi Програмирането на бази данни е свързано с използването на някои специфични инструменти и подходи. Най-общо, базите данни представляват съвкупност от един или няколко файла, които съдържат записно-ориентирани съвкупности от данни...