一、前言
遇到一个需求,需要求数组中出现次数最多的元素,查找了一些资料,结合自己的思路,编写了程序并验证。
只考虑元素为非负整数的数组,如果有出现次数相同的元素,则返回较小元素。
二、编程思路
以数组元素数据类型为16位整数为例,元素个数也为16位整数,最多65535个。
遍历数组元素,记录每一个值出现的次数,因为我们不知道元素的值与出现的次数,到底哪个最多,可能遍历到最后一个元素时才是次数最多的那一个,所以,需要把每一个值出现的次数都保存起来,到最后才能知道哪个是我们所要求的。如果要保存上述的结果,则还需要创建一个数组,用来保存元素的值、值出现的次数,这里有一个技巧,即利用数组的下标,当作输入数组元素的值,对应的值为该下标出现的次数,否则的话新建的数组需要是二维的。遍历完输入数组后,所创建的数组,每一个位置都会有了一个值,当然,输入数组中没有出现过的值,创建的数组对应的位置会是0;那么问题来了,应该创建一个长度为多少的数组合适呢?可以有以下3种方案:
①、求出输入数组中有多少个不同的值,新建的数组长度即为该值,但该方法,不能使用数组的下标表示输入元素的值,没法一一对应;
②、因为输入数组的元素个数不确定,而且里面有多少不同的值也不确定,所以需要新建一个65536长度的数组,以应对输入数组中可能出现0~65535不同的值;
③、求出输入数组中的最大值,则其中的元素最多就有(最大值+1)种,则新建数组的长度为(最大值+1)即可;
以上3种方法,我们选用第3种。
总结程序流程如下:
①、求输入数组的最大值max1
②、创建一个新的数组,长度为max1+1;
③、遍历输入数组的元素,新建数组的序号,当作元素的值,该序号里保存的值为元素出现的次数,值出现1次则次数增加1次;
④、求新建数组的元素的最大值max2;
⑤、遍历新建数组的元素,找到第1个值为max2的元素,跳出循环,该元素对应的序号(数组下标)即为输入数组中出现次数最多的元素;
以一个较简单的数组为例,说明计算的流程:
1 | 3 | 2 | 2 | 4 | 6 | 5 | 2 | 1 | 3 |
---|
可知数组长度为10,最大值为6;新建一个数组,长度为6+1=7,次数均初始化为0:
元素 | 0 | 1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|---|---|
次数 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
遍历数组,统计各元素出现的次数:
元素 | 0 | 1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|---|---|
次数 | 0 | 2 | 3 | 2 | 1 | 1 | 1 |
则出现次数最多的为元素2,共出现3次;
三、主要程序代码
/*******************************************************************************
* 函数名:GetMaxValue
* 功 能:获取数组元素的最大值
* 参 数:Arr:数组
Len:长度,数组元素个数
* 返回值:最大值
* 说 明:无
*******************************************************************************/
uint16_t GetMaxValue(uint16_t *Arr, uint16_t Len)
{
uint16_t max = 0;
uint16_t i;
for (i = 0; i < Len; i++)
{
if (*(Arr + i) > max)
{
max = *(Arr + i);
}
}
return max;
}
/*******************************************************************************
* 函数名:GetMostFrequentValue
* 功 能:获取数组中出现次数最多的元素
* 参 数:Arr:数组
Len:长度,数组元素个数
* 返回值:最大值value
* 说 明:无
*******************************************************************************/
uint16_t GetMostFrequentValue(uint16_t *Arr, uint16_t Len)
{
uint16_t i;
uint16_t value = 0;
uint16_t max1 = 0;
uint16_t max2 = 0;
max1 = GetMaxValue(Arr, Len);
uint16_t temp[max1 + 1];//用于存放次数的数组,该数组的序号,对应输入数组元素的值
memset(temp, 0, (max1 + 1) * 2);
for (i = 0; i < Len; i++)
{
temp[*(Arr + i)]++;//以元素的值作为temp数组的序号,值出现1次则次数增加1次
}
max2 = GetMaxValue(temp, max1 + 1);//求出次数的最大值
for (i = 0; i < (max1 + 1); i++)//找到第1个最大值,跳出循环
{
if (temp[i] == max2)
{
value = i;
break;//如果要返回较大值,则不需要break
}
}
return value;
}
四、验证
运行环境为STM32单片机,计算的时候,打印出中间过程;
1.数组{1,3,2,2,4,6,5,2,1,3}:
打印数据的左侧一列为元素的值,右侧为相应的次数,因为最大值是6,所以只输出到6,最后输出的结果为2;
2.数组{10,23,12,3,9,6,5,10,1,10,20,9,3,10,9,8,9,15}:
输出的数据中,元素9和10均出现4次,但输出结果为较小值9,正确。
五、总结
1、程序不考虑时间和空间复杂度,并不一定是最优的算法,只是流程简单,易于理解;
2、该方法利用了数组的下标当作与元素对应的值,因此只适用于数组元素为非负整数的情况;
3、输入数组的长度任意,新建的数组为变长数组,所以要用C99的标准;
4、新建的数组下标当作元素的值,实际相当于给输入数组进行了排序,所以找到第1个最大值,跳出循环,如果有出现次数相同的元素,则返回较小元素;