U++ forum: Welcome to the forum

#include "Core.h" // iscale: computes x * y / z. #ifdef flagGCC #define __USE_64BIT_MATH__ #endif NAMESPACE_UPP int iscale(int x, int y, int z) { #ifdef __NOASSEMBLY__ #ifndef __USE_64BIT_MATH__ return int(x * (double)y / z); #else int64_t res = x; res *= y; res /= z; return (int)res; #endif #else __asm { mov eax, [x] imul [y] idiv [z] } #endif } // iscalefloor: computes x * y / z, rounded towards -infty. int iscalefloor(int x, int y, int z) { #ifdef __NOASSEMBLY__ #ifndef __USE_64BIT_MATH__ return (int)ffloor(x * (double)y / z); #else int64_t res = x; int64_t mulres = res * y; res = mulres / z; if(res * z != mulres) res--; return (int)res; #endif #else __asm { mov eax, [x] imul [y] idiv [z] and edx, edx jge __1 dec eax __1: } #endif } // iscaleceil: computes x * y / z, rounded towards +infty. int iscaleceil(int x, int y, int z) { #ifdef __NOASSEMBLY__ #ifndef __USE_64BIT_MATH__ return fceil(x * (double)y / z); #else int64_t res = x; int64_t mulres = res * y; res = mulres / z; if(res * z != mulres) res++; return (int)res; #endif #else __asm { mov eax, [x] imul [y] idiv [z] and edx, edx jle __1 inc eax __1: } #endif }

0041A920  push edi 
0041A921  push esi 
0041A922  push ebx 
0041A923  xor edi,edi 
0041A925  mov eax,[esp+0x14] 
0041A929  or eax,eax 
0041A92B  jnl 0x41a941 
0041A92D  inc edi 
0041A92E  mov edx,[esp+0x10] 
0041A932  neg eax 
0041A934  neg edx 
0041A936  sbb eax,byte +0x0 
0041A939  mov [esp+0x14],eax 
0041A93D  mov [esp+0x10],edx 
0041A941  mov eax,[esp+0x1c] 
0041A945  or eax,eax 
0041A947  jnl 0x41a95d 
0041A949  inc edi 
0041A94A  mov edx,[esp+0x18] 
0041A94E  neg eax 
0041A950  neg edx 
0041A952  sbb eax,byte +0x0 
0041A955  mov [esp+0x1c],eax 
0041A959  mov [esp+0x18],edx 
0041A95D  or eax,eax 
0041A95F  jnz 0x41a979 
0041A961  mov ecx,[esp+0x18] 
0041A965  mov eax,[esp+0x14] 
0041A969  xor edx,edx 
0041A96B  div ecx 
0041A96D  mov ebx,eax 
0041A96F  mov eax,[esp+0x10] 
0041A973  div ecx 
0041A975  mov edx,ebx 
0041A977  jmp short 0x41a9ba 
0041A979  mov ebx,eax 
0041A97B  mov ecx,[esp+0x18] 
0041A97F  mov edx,[esp+0x14] 
0041A983  mov eax,[esp+0x10] 
0041A987  shr ebx,1 
0041A989  rcr ecx,1 
0041A98B  shr edx,1 
0041A98D  rcr eax,1 
0041A98F  or ebx,ebx 
0041A991  jnz 0x41a987 
0041A993  div ecx 
0041A995  mov esi,eax 
0041A997  mul dword [esp+0x1c] 
0041A99B  mov ecx,eax 
0041A99D  mov eax,[esp+0x18] 
0041A9A1  mul esi 
0041A9A3  add edx,ecx 
0041A9A5  jc 0x41a9b5 
0041A9A7  cmp edx,[esp+0x14] 
0041A9AB  ja 0x41a9b5 
0041A9AD  jc 0x41a9b6 
0041A9AF  cmp eax,[esp+0x10] 
0041A9B3  jna 0x41a9b6 
0041A9B5  dec esi 
0041A9B6  xor edx,edx 
0041A9B8  mov eax,esi 
0041A9BA  dec edi 
0041A9BB  jnz 0x41a9c4 
0041A9BD  neg edx 
0041A9BF  neg eax 
0041A9C1  sbb edx,byte +0x0 
0041A9C4  pop ebx 
0041A9C5  pop esi 
0041A9C6  pop edi 
0041A9C7  ret 0x10

I can agree, but I think more and more that the lack of width specs in C++ is really a nasty stuff. Now it's too late, but if I'd have to write a framework from scratch, I'd use some typedef'd int8, int16, int32 and so on stuffs.

0041A920 push edi 0041A921 push esi 0041A922 push ebx 0041A923 xor edi,edi 0041A925 mov eax,[esp+0x14] 0041A929 or eax,eax 0041A92B jnl 0x41a941 0041A92D inc edi 0041A92E mov edx,[esp+0x10] 0041A932 neg eax 0041A934 neg edx 0041A936 sbb eax,byte +0x0 0041A939 mov [esp+0x14],eax 0041A93D mov [esp+0x10],edx 0041A941 mov eax,[esp+0x1c] 0041A945 or eax,eax 0041A947 jnl 0x41a95d 0041A949 inc edi 0041A94A mov edx,[esp+0x18] 0041A94E neg eax 0041A950 neg edx 0041A952 sbb eax,byte +0x0 0041A955 mov [esp+0x1c],eax 0041A959 mov [esp+0x18],edx 0041A95D or eax,eax 0041A95F jnz 0x41a979 0041A961 mov ecx,[esp+0x18] 0041A965 mov eax,[esp+0x14] 0041A969 xor edx,edx 0041A96B div ecx 0041A96D mov ebx,eax 0041A96F mov eax,[esp+0x10] 0041A973 div ecx 0041A975 mov edx,ebx 0041A977 jmp short 0x41a9ba 0041A979 mov ebx,eax 0041A97B mov ecx,[esp+0x18] 0041A97F mov edx,[esp+0x14] 0041A983 mov eax,[esp+0x10] 0041A987 shr ebx,1 0041A989 rcr ecx,1 0041A98B shr edx,1 0041A98D rcr eax,1 0041A98F or ebx,ebx 0041A991 jnz 0x41a987 0041A993 div ecx 0041A995 mov esi,eax 0041A997 mul dword [esp+0x1c] 0041A99B mov ecx,eax 0041A99D mov eax,[esp+0x18] 0041A9A1 mul esi 0041A9A3 add edx,ecx 0041A9A5 jc 0x41a9b5 0041A9A7 cmp edx,[esp+0x14] 0041A9AB ja 0x41a9b5 0041A9AD jc 0x41a9b6 0041A9AF cmp eax,[esp+0x10] 0041A9B3 jna 0x41a9b6 0041A9B5 dec esi 0041A9B6 xor edx,edx 0041A9B8 mov eax,esi 0041A9BA dec edi 0041A9BB jnz 0x41a9c4 0041A9BD neg edx 0041A9BF neg eax 0041A9C1 sbb edx,byte +0x0 0041A9C4 pop ebx 0041A9C5 pop esi 0041A9C6 pop edi 0041A9C7 ret 0x10

.globl _ZN3Upp6iscaleEiii .type _ZN3Upp6iscaleEiii, @function _ZN3Upp6iscaleEiii: .LFB4039: .file 4 "/home/massimo/sources/upp-svn/uppsrc/Core/mathutil.cpp" .loc 4 11 0 pushq %rbp .LCFI15: movq %rsp, %rbp .LCFI16: movl %edi, -20(%rbp) movl %esi, -24(%rbp) movl %edx, -28(%rbp) .LBB2: .loc 4 17 0 movl -20(%rbp), %eax cltq movq %rax, -8(%rbp) .loc 4 18 0 movl -24(%rbp), %eax movslq %eax,%rdx movq -8(%rbp), %rax imulq %rdx, %rax movq %rax, -8(%rbp) .loc 4 19 0 movl -28(%rbp), %eax cltq movq -8(%rbp), %rdx movq %rax, %rcx movq %rdx, %rax sarq $63, %rdx idivq %rcx movq %rax, -8(%rbp) .loc 4 20 0 movq -8(%rbp), %rax .LBE2: .loc 4 30 0 leave ret