FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE2317, 1051 aa
1>>>pF1KE2317 1051 - 1051 aa - 1051 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.8593+/-0.000918; mu= 19.4331+/- 0.056
mean_var=82.6216+/-16.426, 0's: 0 Z-trim(107.2): 32 B-trim: 162 in 1/52
Lambda= 0.141100
statistics sampled from 9378 (9410) to 9378 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.645), E-opt: 0.2 (0.289), width: 16
Scan time: 4.130
The best scores are: opt bits E(32554)
CCDS11558.1 ITGA3 gene_id:3675|Hs108|chr17 (1051) 7114 1458.6 0
CCDS2669.1 ITGA9 gene_id:3680|Hs108|chr3 (1035) 1010 216.0 3.3e-55
CCDS42788.1 ITGA4 gene_id:3676|Hs108|chr2 (1032) 962 206.3 2.9e-52
CCDS44914.1 ITGA7 gene_id:3679|Hs108|chr12 (1044) 953 204.4 1e-51
CCDS2292.1 ITGAV gene_id:3685|Hs108|chr2 (1048) 948 203.4 2.1e-51
CCDS46471.1 ITGAV gene_id:3685|Hs108|chr2 (1002) 901 193.8 1.5e-48
CCDS31155.1 ITGA8 gene_id:8516|Hs108|chr10 (1063) 863 186.1 3.4e-46
CCDS46470.1 ITGAV gene_id:3685|Hs108|chr2 (1012) 847 182.9 3.1e-45
CCDS32665.1 ITGA2B gene_id:3674|Hs108|chr17 (1039) 722 157.4 1.5e-37
CCDS32433.1 ITGAL gene_id:3683|Hs108|chr16 (1170) 679 148.7 6.9e-35
CCDS76204.1 ITGA10 gene_id:8515|Hs108|chr1 (1024) 670 146.8 2.2e-34
CCDS8880.1 ITGA5 gene_id:3678|Hs108|chr12 (1049) 670 146.8 2.3e-34
CCDS72869.1 ITGA10 gene_id:8515|Hs108|chr1 (1167) 670 146.9 2.5e-34
CCDS45291.1 ITGA11 gene_id:22801|Hs108|chr15 (1188) 656 144.0 1.8e-33
CCDS45461.1 ITGAL gene_id:3683|Hs108|chr16 (1086) 655 143.8 1.9e-33
CCDS32531.1 ITGAE gene_id:3682|Hs108|chr17 (1179) 621 136.9 2.5e-31
CCDS32438.1 ITGAD gene_id:3681|Hs108|chr16 (1161) 573 127.1 2.2e-28
CCDS54004.1 ITGAM gene_id:3684|Hs108|chr16 (1153) 556 123.6 2.4e-27
CCDS8888.1 ITGA7 gene_id:3679|Hs108|chr12 (1137) 549 122.2 6.3e-27
CCDS45470.1 ITGAM gene_id:3684|Hs108|chr16 (1152) 549 122.2 6.3e-27
CCDS55832.1 ITGA7 gene_id:3679|Hs108|chr12 (1141) 534 119.2 5.2e-26
CCDS10711.1 ITGAX gene_id:3687|Hs108|chr16 (1163) 509 114.1 1.8e-24
CCDS67014.1 ITGAX gene_id:3687|Hs108|chr16 (1169) 509 114.1 1.8e-24
CCDS3957.1 ITGA2 gene_id:3673|Hs108|chr5 (1181) 461 104.3 1.6e-21
CCDS82534.1 ITGA6 gene_id:3655|Hs108|chr2 ( 954) 454 102.8 3.6e-21
CCDS2249.1 ITGA6 gene_id:3655|Hs108|chr2 (1073) 454 102.9 4e-21
CCDS46451.1 ITGA6 gene_id:3655|Hs108|chr2 (1091) 454 102.9 4e-21
>>CCDS11558.1 ITGA3 gene_id:3675|Hs108|chr17 (1051 aa)
initn: 7114 init1: 7114 opt: 7114 Z-score: 7819.9 bits: 1458.6 E(32554): 0
Smith-Waterman score: 7114; 99.9% identity (100.0% similar) in 1051 aa overlap (1-1051:1-1051)
10 20 30 40 50 60
pF1KE2 MGPGPSRAPRAPRLMLCALALMVAAGGCVVSAFNLDTRFLVVKEAGNPGSLFGYSVALHR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 MGPGPSRAPRAPRLMLCALALMVAAGGCVVSAFNLDTRFLVVKEAGNPGSLFGYSVALHR
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE2 QTERQQRYLLLAGAPRELAVPDGYTNRTGAVYLCPLTAHKDDCERMNITVKNDPGHHIIE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 QTERQQRYLLLAGAPRELAVPDGYTNRTGAVYLCPLTAHKDDCERMNITVKNDPGHHIIE
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE2 DMWLGVTVASQGPAGRVLVCAHRYTQVLWSGSEDQRRMVGKCYVRGNDLELDSSDDWQTY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 DMWLGVTVASQGPAGRVLVCAHRYTQVLWSGSEDQRRMVGKCYVRGNDLELDSSDDWQTY
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE2 HNEMCNSNTDYLETGMCQLGTSGGFTQNTVYFGAPGAYNWKGNSYMIQRKEWDLSEYSYK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 HNEMCNSNTDYLETGMCQLGTSGGFTQNTVYFGAPGAYNWKGNSYMIQRKEWDLSEYSYK
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE2 DPEDQGNLYIGYTMQVGSFILHPKNITIVTGAPRHRHMGAVFLLSQEAGGDLRRRQVLEG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 DPEDQGNLYIGYTMQVGSFILHPKNITIVTGAPRHRHMGAVFLLSQEAGGDLRRRQVLEG
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE2 SQVGAYFGSAIALADLNNDGWQDLLVGAPYYFERKEEVGGAIYVFMNQAGTSFPAHPSLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 SQVGAYFGSAIALADLNNDGWQDLLVGAPYYFERKEEVGGAIYVFMNQAGTSFPAHPSLL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE2 LHGPSGSAFGLSVASIGDINQDGFQDIAVGAPFEGLGKVYIYHSSSKGLLRQPQQVIHGE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 LHGPSGSAFGLSVASIGDINQDGFQDIAVGAPFEGLGKVYIYHSSSKGLLRQPQQVIHGE
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE2 KLGLPGLATFGYSLSGQMDVDENFYPDLLVGSLSDHIVLLRARPVINIVHKTLVPRPAVL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 KLGLPGLATFGYSLSGQMDVDENFYPDLLVGSLSDHIVLLRARPVINIVHKTLVPRPAVL
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE2 DPALCTATSCVQVELCFAYNQSAGNPNYRRNITLAYTLEADRDRRPPRLRFAGSESAVFH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 DPALCTATSCVQVELCFAYNQSAGNPNYRRNITLAYTLEADRDRRPPRLRFAGSESAVFH
490 500 510 520 530 540
550 560 570 580 590 600
pF1KE2 GFFSMPEMRCQKLELLLMDNLRDKLRPIIISMNYSLPLRMPDRPRLGLRSLDAYPILNQA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 GFFSMPEMRCQKLELLLMDNLRDKLRPIIISMNYSLPLRMPDRPRLGLRSLDAYPILNQA
550 560 570 580 590 600
610 620 630 640 650 660
pF1KE2 QALENHTEVQFQKECGPDNKCESNLQMRAAFVSEQQQKLSRLQYSRDVRKLLLSINVTNT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 QALENHTEVQFQKECGPDNKCESNLQMRAAFVSEQQQKLSRLQYSRDVRKLLLSINVTNT
610 620 630 640 650 660
670 680 690 700 710 720
pF1KE2 RTSERSGEDAHEALLTLVVPPALLLSSVRPPGACQANETIFCELGNPFKRNQRMELLITF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::.:
CCDS11 RTSERSGEDAHEALLTLVVPPALLLSSVRPPGACQANETIFCELGNPFKRNQRMELLIAF
670 680 690 700 710 720
730 740 750 760 770 780
pF1KE2 EVIGVTLHTRDLQVQLQLSTSSHQDNLWPMILTLLVDYTLQTSLSMVNHRLQSFFGGTVM
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 EVIGVTLHTRDLQVQLQLSTSSHQDNLWPMILTLLVDYTLQTSLSMVNHRLQSFFGGTVM
730 740 750 760 770 780
790 800 810 820 830 840
pF1KE2 GESGMKTVEDVGSPLKYEFQVGPMGEGLVGLGTLVLGLEWPYEVSNGKWLLYPTEITVHG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 GESGMKTVEDVGSPLKYEFQVGPMGEGLVGLGTLVLGLEWPYEVSNGKWLLYPTEITVHG
790 800 810 820 830 840
850 860 870 880 890 900
pF1KE2 NGSWPCRPPGDLINPLNLTLSDPGDRPSSPQRRRRQLDPGGGQGPPPVTLAAAKKAKSET
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 NGSWPCRPPGDLINPLNLTLSDPGDRPSSPQRRRRQLDPGGGQGPPPVTLAAAKKAKSET
850 860 870 880 890 900
910 920 930 940 950 960
pF1KE2 VLTCATGRAHCVWLECPIPDAPVVTNVTVKARVWNSTFIEDYRDFDRVRVNGWATLFLRT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 VLTCATGRAHCVWLECPIPDAPVVTNVTVKARVWNSTFIEDYRDFDRVRVNGWATLFLRT
910 920 930 940 950 960
970 980 990 1000 1010 1020
pF1KE2 SIPTINMENKTTWFSVDIDSELVEELPAEIELWLVLVAVGAGLLLLGLIILLLWKCGFFK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS11 SIPTINMENKTTWFSVDIDSELVEELPAEIELWLVLVAVGAGLLLLGLIILLLWKCGFFK
970 980 990 1000 1010 1020
1030 1040 1050
pF1KE2 RARTRALYEAKRQKAEMKSQPSETERLTDDY
:::::::::::::::::::::::::::::::
CCDS11 RARTRALYEAKRQKAEMKSQPSETERLTDDY
1030 1040 1050
>>CCDS2669.1 ITGA9 gene_id:3680|Hs108|chr3 (1035 aa)
initn: 366 init1: 265 opt: 1010 Z-score: 1104.7 bits: 216.0 E(32554): 3.3e-55
Smith-Waterman score: 1103; 26.7% identity (57.5% similar) in 1085 aa overlap (1-1036:1-1023)
10 20 30 40 50
pF1KE2 MGPGPSRAPR-APRLMLCALALMVAAGGCVVSAFNLDTRFLVVKEAGNPGSLFGYSVALH
:: ::. ::: : :: :::.:: : ..:.::: . :. : :.:::.: :
CCDS26 MG-GPA-APRGAGRLRALLLALVVA--GIPAGAYNLDPQR-PVHFQGPADSFFGYAVLEH
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 RQTERQQRYLLLAGAPRELAVPDGYTNRTGAVYLCPLTAHKDD-CERMNITVKNDPG---
. . :..:. :::. . . .. :::. : . .. : : ..... .. :
CCDS26 FHDNT--RWVLV-GAPKADSKYSPSVKSPGAVFKCRVHTNPDRRCTELDMARGKNRGTSC
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE2 ----HHIIEDMWLGVTVASQGPA-GRVLVCAHRYTQVLWSGSEDQRRMVGKCYVRGNDLE
.. .: :.::..: : : ::::.::::. .. . . :. : ::. ..:.
CCDS26 GKTCREDRDDEWMGVSLARQPKADGRVLACAHRWKNIYYEA--DHILPHGFCYIIPSNLQ
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE2 LDSSDDWQTYHNEMCNSNTDYLETGMCQLGTSGGFTQNTVYFGAPGAYNWKGNSYMIQRK
. :. :. .. . : : :: : .: ::.. : .::::.. : :. ..
CCDS26 AKGRTLIPCYE-EYKKKYGE--EHGSCQAGIAGFFTEELVVMGAPGSFYWAGTIKVL---
180 190 200 210 220
240 250 260 270 280
pF1KE2 EWDLSEYSYKDPEDQGNL-----YIGYTMQVGSFILHPKNITIVTGAPRHRHMGAVFLL-
.:.. .: .:. . :.::.. .: : ::..: .: :::. . .: :...
CCDS26 --NLTDNTYLKLNDEVIMNRRYTYLGYAVTAGHFS-HPSTIDVVGGAPQDKGIGKVYIFR
230 240 250 260 270 280
290 300 310 320 330 340
pF1KE2 SQEAGGDLRRRQVLEGSQVGAYFGSAIALADLNNDGWQDLLVGAPYYFERKEEVGGAIYV
... .: : . :...:.::::.. .:::.:: .:::::::.. : ..: : . :
CCDS26 ADRRSGTLIKIFQASGKKMGSYFGSSLCAVDLNGDGLSDLLVGAPMFSEIRDE--GQVTV
290 300 310 320 330
350 360 370 380 390 400
pF1KE2 FMNQAGTSFPAHPSLLLHGPSGSAFGLSVASIGDINQDGFQDIAVGAPFEG--LGKVYIY
..:... .. . .: : .. :: :.::. :...::: :.:.::: : : ::::
CCDS26 YINRGNGALEEQLALTGDGAYNAHFGESIASLDDLDNDGFPDVAIGAPKEDDFAGAVYIY
340 350 360 370 380 390
410 420 430 440 450 460
pF1KE2 HSSSKGLLRQPQQVIHGEKLGLPGLATFGYSLSGQMDVDENFYPDLLVGS-LSDHIVLLR
:... :.. : .. . :.:.. : : :: :.:: .:.: : :::. ::. .:: .::::
CCDS26 HGDAGGIVPQYSMKLSGQKIN-PVLRMFGQSISGGIDMDGNGYPDVTVGAFMSDSVVLLR
400 410 420 430 440 450
470 480 490 500 510
pF1KE2 ARPVINIVHKTLVPRPAVLDPALC----TATSCVQVELCFAYNQSAGNPNYRRNITLAYT
:::::.. . ..: . : ..:..: ::... . :. .: : :.
CCDS26 ARPVITVDVSIFLPGSINITAPQCHDGQQPVNCLNVTTCFSFH-GKHVPG---EIGLNYV
460 470 480 490 500 510
520 530 540 550 560
pF1KE2 LEADRDRRP----PRLRFA--G-SESAVFHGF-FSMPEMRCQKLELLLMDNLRDKLRPII
: :: .. ::. :. : . . : . . ... : :.. . ..: . ::.
CCDS26 LMADVAKKEKGQMPRVYFVLLGETMGQVTEKLQLTYMEETCRHYVAHVKRRVQDVISPIV
520 530 540 550 560 570
570 580 590 600 610 620
pF1KE2 ISMNYSLPLRMPDRPRLGLRSLDAYPIL--NQAQALENHTEVQFQKECGPDNKCESNLQM
. ::: .. . . : : :.: ...: . ..... :...: .. : ..::.
CCDS26 FEAAYSLSEHVTGEEERELPPLT--PVLRWKKGQKIAQKNQTVFERNCRSED-CAADLQL
580 590 600 610 620 630
630 640 650 660 670 680
pF1KE2 RAAFV-SEQQQKLSRLQYSRDVRKLLLSINVTNTRTSERSGEDAHEALLTLVVPPALLLS
.. .. : ...: : . :... :.:...: :.::..: ... : :..
CCDS26 QGKLLLSSMDEKTLYLALGA-VKNISLNISISNL------GDDAYDANVSFNVSRELFFI
640 650 660 670 680
690 700 710 720 730
pF1KE2 SV---RPPG-ACQANETIF--CELGNPFKRNQ-RMELLITFEVIGVTLHTRDLQ--VQLQ
.. . : .:. :. : : .: :: :.. ..:. . :.. .. . . :. : :
CCDS26 NMWQKEEMGISCELLESDFLKCSVGFPFMRSKSKYEFSVIFDTSHLSGEEEVLSFIVTAQ
690 700 710 720 730 740
740 750 760 770 780 790
pF1KE2 LSTSSHQDNLWPMILTLLVDYTLQTSLSMVN-HRLQSFFGGTVMGESGMKTVEDVG---S
... ....: :.:.: ... :... :: : . ... ..:. .
CCDS26 SGNTERSESLHDNTLVLMVPLMHEVDTSITGIMSPTSFVYGESVDAANFIQLDDLECHFQ
750 760 770 780 790 800
800 810 820 830 840 850
pF1KE2 PLKYEFQVGPMGEGLVGLGTLVLGLEWPYEVSNGKWLLYPTEITVHGNGSWPCRPPGDLI
:.. .:: : . . :. : .. .: ..:.: .. .. : :. . :
CCDS26 PINITLQVYNTGPSTLP-GSSV-SISFPNRLSSGGAEMFHVQEMVVGQEKGNCSFQK---
810 820 830 840 850
860 870 880 890 900 910
pF1KE2 NPLNLTLSDPGDRPSSPQRRRRQLDPGGGQGPPPVTLAAAKKAKSETVLTCATGRAHCVW
:: . ::... . :. : ... :: : :.
CCDS26 NPTPCII---------PQEQENIFH----------TIFAFFTKSGRKVLDCEKPGISCLT
860 870 880 890 900
920 930 940 950 960 970
pF1KE2 LECPIPDAPVVTNVTVKARVWNSTFIEDYRDFDRVRVNGWATLFLRTSIPTINMENKTTW
.: . . :. . .: : . . .. . : . . .. .... . .
CCDS26 AHCNFSALAKEESRTIDIYMLLNTEILKKDSSSVIQFMSRAKVKVDPALRVVEIAHGNPE
910 920 930 940 950 960
980 990 1000 1010 1020 1030
pF1KE2 FSVDIDSELVEELPAE--IELWLVLVAVGAGLLLLGLIILLLWKCGFFKRARTRALYEAK
: . : ...: . . :.. ... .:.:.. :. .:::: :::.: : . . ::.
CCDS26 -EVTVVFEALHNLEPRGYVVGWIIAISLLVGILIFLLLAVLLWKMGFFRR-RYKEIIEAE
970 980 990 1000 1010
1040 1050
pF1KE2 RQKAEMKSQPSETERLTDDY
... :
CCDS26 KNRKENEDSWDWVQKNQ
1020 1030
>>CCDS42788.1 ITGA4 gene_id:3676|Hs108|chr2 (1032 aa)
initn: 483 init1: 243 opt: 962 Z-score: 1051.9 bits: 206.3 E(32554): 2.9e-52
Smith-Waterman score: 1048; 27.4% identity (56.3% similar) in 1076 aa overlap (3-1033:9-1019)
10 20 30 40 50
pF1KE2 MGPGPSRAPRAPRLMLCALALMVAAGGCVVSAFNLDTRFLVVKEAGNPGSLFGY
::: :: .:: : : : .: .:.::. .. . : ..::::
CCDS42 MAWEARREPGPRRAAVRETVMLL-LCLGVPTG----RPYNVDTESALLYQ-GPHNTLFGY
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 SVALHRQTERQQRYLLLAGAPRELAVPDGYTNRTGAVYLCPLTAHKDD-CERMNITVKN-
::.:: .. .:.::. ::: . .. . ::.: : . . . ::.... :
CCDS42 SVVLH--SHGANRWLLV-GAPTANWLANASVINPGAIYRCRIGKNPGQTCEQLQLGSPNG
60 70 80 90 100 110
120 130 140 150 160
pF1KE2 DP-GHHIIED---MWLGVTVASQ-GPAGRVLVCAHRYTQVLWSGSEDQRRMVGKCYVRGN
.: :. .:. .:::::.. : : : ...:.::. .... .:. . .: ::
CCDS42 EPCGKTCLEERDNQWLGVTLSRQPGENGSIVTCGHRWKNIFYIKNEN-KLPTGGCYGVPP
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE2 DLELDSSDDWQTYHNEMCNSNTDYLETGMCQLGTSGGFTQNTVYFGAPGAYNWKGNSYMI
::. . : .... .. . . . :: : :. .:.. . .::::. : :. ..
CCDS42 DLRTELSKRIAPCYQDYVKKFGENFAS--CQAGISSFYTKDLIVMGAPGSSYWTGSLFV-
180 190 200 210 220
230 240 250 260 270 280
pF1KE2 QRKEWDLSEYSYK---DPEDQGNL--YIGYTMQVGSFILHPKNITIVTGAPRHRHMGAVF
.... .:: : ..: .. :.::.. .: : .. .: :::.:...: ..
CCDS42 ----YNITTNKYKAFLDKQNQVKFGSYLGYSVGAGHF-RSQHTTEVVGGAPQHEQIGKAY
230 240 250 260 270 280
290 300 310 320 330 340
pF1KE2 LLSQEAGGDLRRRQVLEGSQVGAYFGSAIALADLNNDGWQDLLVGAPYYFERKEEVGGAI
..: . .: . ..:...:.:::... .::: ::..:::::::. .:: : .
CCDS42 IFSIDEK-ELNILHEMKGKKLGSYFGASVCAVDLNADGFSDLLVGAPMQSTIREE--GRV
290 300 310 320 330
350 360 370 380 390
pF1KE2 YVFMNQ-AGTSFPAHPSLLLHGPSGSA-FGLSVASIGDINQDGFQDIAVGAPFEG--LGK
.:..:. .:. . : . :. . . .: :: :....:::..:::.:.:.::: : :
CCDS42 FVYINSGSGAVMNAMETNLVGSDKYAARFGESIVNLGDIDNDGFEDVAIGAPQEDDLQGA
340 350 360 370 380 390
400 410 420 430 440 450
pF1KE2 VYIYHSSSKGLLRQPQQVIHGEKLGLPGLATFGYSLSGQMDVDENFYPDLLVGSL-SDHI
.:::.. . :. .: :.: ... .:. :: :.:::.:.:.: : :. ::.. ::
CCDS42 IYIYNGRADGISSTFSQRIEGLQIS-KSLSMFGQSISGQIDADNNGYVDVAVGAFRSDSA
400 410 420 430 440 450
460 470 480 490 500 510
pF1KE2 VLLRARPVINIVHKTLV-PRPAVLDPALCTATS----CVQVELCFAYNQSAGNPNYRRNI
::::.:::. :: .: :. . :. .. :... :::.: .. :.: :
CCDS42 VLLRTRPVV-IVDASLSHPESVNRTKFDCVENGWPSVCIDLTLCFSY-KGKEVPGY---I
460 470 480 490 500 510
520 530 540 550 560
pF1KE2 TLAYTLEADRDRR---PPRLRFAGS-ESAVFHGFFSMP--EMRCQKLELLLMDNLRDKLR
.: :.. : .:. :::. :... : :. : ... : :. . .. ..:: :
CCDS42 VLFYNMSLDVNRKAESPPRFYFSSNGTSDVITGSIQVSSREANCRTHQAFMRKDVRDILT
520 530 540 550 560 570
570 580 590 600 610 620
pF1KE2 PIIISMNYSL-PLRMPDRPRLGLRSLDAYPILNQAQALENHTE-VQFQKECGPDNKCESN
:: : : : : . : . :. :::.: . . . ..: . :. .: : ..
CCDS42 PIQIEAAYHLGPHVISKRSTEEFPPLQ--PILQQKKEKDIMKKTINFARFCAHEN-CSAD
580 590 600 610 620 630
630 640 650 660 670 680
pF1KE2 LQMRA--AFVSEQQQKLSRLQYSRDVRKLLLSINVTNTRTSERSGEDAHEALLTLVVPPA
::. : .:.. ...: . : . ... :.:.... : .:.::.:. : . .: .
CCDS42 LQVSAKIGFLKPHENK-TYLAVG-SMKTLMLNVSLFN------AGDDAYETTLHVKLPVG
640 650 660 670 680
690 700 710 720 730 740
pF1KE2 LLLSSVRPPGACQANETIFCELGNPFKRNQRMELLITFEVIGVTLHTR-DLQVQLQLSTS
: . .. : : ::. . . ..: .. : : .: :.. :..:.
CCDS42 LYFIKILELEEKQIN----CEVTD---NSGVVQLDCSIGYIYVDHLSRIDISFLLDVSSL
690 700 710 720 730
750 760 770 780 790 800
pF1KE2 SHQDNLWPMILTLLVDYTLQTSLSMVNHRLQSFFGGTVMGESGMKTVEDVGSPLKYEFQV
:. .. :.. : : .. : : . . . . ::. .: .. .
CCDS42 SRAEE----DLSITVHATCENEEEMDNLKHSRVTVAIPLKYEVKLTVHGFVNPTSFVYGS
740 750 760 770 780 790
810 820 830 840 850
pF1KE2 GPMGEGLVGLGTLVLGLEWPYEVSNGKWLLYPT---EITVHGNGSWPCRPPGD-LINPLN
. .: . .: .. ..: : . :. :: : .. : : : :.: :.
CCDS42 NDENEPET---CMVEKMNLTFHVINTGNSMAPNVSVEIMVPNSFS----PQTDKLFNILD
800 810 820 830 840
860 870 880 890 900 910
pF1KE2 LTLSDPGDRPSSPQRRRRQLDPGGGQGPPPVTLAAAKKAKSET---VLTCATGRAHCVWL
. . :. .: :. : :: . . :.: .: : . ::. .
CCDS42 VQTTT-GECHFENYQRVCALEQ---QKSAMQTLKGIVRFLSKTDKRLLYCIKADPHCLNF
850 860 870 880 890 900
920 930 940 950 960 970
pF1KE2 ECPIPDAPVVTNVTVKARVWNSTFIEDYRDFDRVRVNGWATLFLRTSIPTINMENKTTWF
: . ...:. .. . : .. . . .. . :: : . . : . ::
CCDS42 LCNFGKMESGKEASVHIQLEGRPSILEMDETSALKFEIRATGFPEPN-PRVIELNKDE--
910 920 930 940 950
980 990 1000 1010 1020
pF1KE2 SVDIDSELVEELPAEIELWLVLVAVGAGLLLLGLIILLL-----WKCGFFKRARTRALYE
.. :.: : . ... .. ::::::.::: :: ::::: : :
CCDS42 --NVAHVLLEGLHHQRPKRYFTIVIISSSLLLGLIVLLLISYVMWKAGFFKRQYKSILQE
960 970 980 990 1000 1010
1030 1040 1050
pF1KE2 AKRQKAEMKSQPSETERLTDDY
.:.
CCDS42 ENRRDSWSYINSKSNDD
1020 1030
>>CCDS44914.1 ITGA7 gene_id:3679|Hs108|chr12 (1044 aa)
initn: 1260 init1: 348 opt: 953 Z-score: 1041.9 bits: 204.4 E(32554): 1e-51
Smith-Waterman score: 1850; 36.7% identity (64.4% similar) in 986 aa overlap (140-1043:43-1000)
110 120 130 140 150 160
pF1KE2 VKNDPGHHIIEDMWLGVTVASQGPAGRVLVCAHRYT------QVLWSGSEDQRRMVGKCY
::::: :.: . : :.:.:.
CCDS44 TTTRIQRQAEGFQCWRECGTRRSPFEGKETCAHRYEARQRVDQIL-----ETRDMIGRCF
20 30 40 50 60
170 180 190 200 210
pF1KE2 VRGNDL----ELDSSDDWQTYHNEMCNSNTDYLET-GMCQLGTSGGFTQNTVY--FGAPG
: ..:: :::... :. .:.. . : :.:: ::...:. .. : :::::
CCDS44 VLSQDLAIRDELDGGE-WK-----FCEGRPQGHEQFGFCQQGTAAAFSPDSHYLLFGAPG
70 80 90 100 110 120
220 230 240 250 260
pF1KE2 AYNWKGNSY--MIQRKEWDLSEYS---Y-------KDPED---QGNLYIGYTMQVGSFIL
.:::::.. . . ::.. . : .::. .: :.:.... :. ..
CCDS44 TYNWKGTARVELCAQGSADLAHLDDGPYEAGGEKEQDPRLIPVPANSYFGFSIDSGKGLV
130 140 150 160 170 180
270 280 290 300 310 320
pF1KE2 HPKNITIVTGAPRHRHMGAVFLLSQEAGGDLRRRQVLEGSQVGAYFGSAIALADLNNDGW
. .....:.:::: : ::: .: ..... : . .: : .. . :: ..:.::::.:::
CCDS44 RAEELSFVAGAPRANHKGAVVILRKDSASRLVPEVMLSGERLTSGFGYSLAVADLNSDGW
190 200 210 220 230 240
330 340 350 360 370 380
pF1KE2 QDLLVGAPYYFERKEEVGGAIYVFMNQAGTSFPAHPSLLLHGPSGSAFGLSVASIGDINQ
::.:::::.:::.::.:::.::..::.: : : : : : ::.:.: .::.::
CCDS44 PDLIVGAPYFFERQEELGGAVYVYLNQGGHWAGISP-LRLCGSPDSMFGISLAVLGDLNQ
250 260 270 280 290 300
390 400 410 420 430 440
pF1KE2 DGFQDIAVGAPFEGLGKVYIYHSSSKGLLRQPQQVIHGEKLGLPGLATFGYSLSGQMDVD
::: ::::::::.: :::.:::.:: :.. .:.::..:: .:. .:::::::..:.:
CCDS44 DGFPDIAVGAPFDGDGKVFIYHGSSLGVVAKPSQVLEGEAVGIK---SFGYSLSGSLDMD
310 320 330 340 350
450 460 470 480 490
pF1KE2 ENFYPDLLVGSLSDHIVLLRARPVINIVHK-TLVPRPAVLDPALCTA--TSCVQVELCFA
: :::::::::.: ::.::::.... :. ...:: :. :.. . ::....::.
CCDS44 GNQYPDLLVGSLADTAVLFRARPILHVSHEVSIAPRSIDLEQPNCAGGHSVCVDLRVCFS
360 370 380 390 400 410
500 510 520 530 540
pF1KE2 YNQSAGNPNYRRNITLAYTLEADRDRR----PPRLRFAG------SESAVFHGFFSMPEM
: : .: ...: :.:.:: ::: ::. : . ...: ... .
CCDS44 YI--AVPSSYSPTVALDYVLDADTDRRLRGQVPRVTFLSRNLEEPKHQASGTVWLKHQHD
420 430 440 450 460 470
550 560 570 580 590 600
pF1KE2 R-CQKLELLLMDNLRDKLRPIIISMNYSL--PLRMPDRPRLGLRSLDAYPILNQAQALEN
: : . :..:..:::: :.....::: : . : :: . :::: : .
CCDS44 RVCGDAMFQLQENVKDKLRAIVVTLSYSLQTPRLRRQAPGQGLPPVA--PILNAHQPSTQ
480 490 500 510 520 530
610 620 630 640 650
pF1KE2 HTEVQFQKE-CGPDNKCESNLQM-RAAFVSE-QQQKLSRLQYSRDVRKLLLSIN------
..:..: :. :: :. :.::::. :: : .. .. ... : .. : :....
CCDS44 RAEIHFLKQGCGEDKICQSNLQLVRARFCTRVSDTEFQPLPMDVDGTTALFALSGQPVIG
540 550 560 570 580 590
660 670 680 690 700
pF1KE2 ----VTNTRTS----ERSGEDAHEALLTLVVPPALLLSSVRP--PGA---CQANET---I
::: .. . .:.::::: : ...: .: :.:: :. : .::. .
CCDS44 LELMVTNLPSDPAQPQADGDDAHEAQLLVMLPDSLHYSGVRALDPAEKPLCLSNENASHV
600 610 620 630 640 650
710 720 730 740 750 760
pF1KE2 FCELGNPFKRNQRMELLITFEVIGVTLHTRDLQVQLQLSTSSHQDNLWPMILTLLVDYTL
::::::.::. .. . . . . :....: .:.:.: :.: :.:. : :. : :
CCDS44 ECELGNPMKRGAQVTFYLILSTSGISIETTELEVELLLATISEQE-LHPVSARARVFIEL
660 670 680 690 700 710
770 780 790 800 810 820
pF1KE2 QTSLSMVNHRLQSFFGGTVMGESGMKTVEDVGSPLKYEFQVGPMGEGLVGLGTLVLGLEW
:.. . : ::.:.: :: .:.. .:::: .::: :. .:..: ::. :.. :
CCDS44 PLSIAGMAIPQQLFFSGVVRGERAMQSERDVGSKVKYEVTVSNQGQSLRTLGSAFLNIMW
720 730 740 750 760 770
830 840 850 860 870
pF1KE2 PYEVSNGKWLLYPTEITVHGNGSWPCRPPGDLINPL-NLTLSDPGDRPSSPQRRRRQLDP
:.:..:::::::: .. ..: :. : . : .: :. : .: .::::.:.:
CCDS44 PHEIANGKWLLYPMQVELEG-GQGPGQK--GLCSPRPNILHLDVDSR----DRRRRELEP
780 790 800 810 820
880 890 900 910 920 930
pF1KE2 GGGQGP-----PPVT---LAAAKKAKSETVLTCATGRAHCVWLECPIPDAPVVTNVTVKA
: : : .. ...:.: :. : : :: : :.:: . ::. . .. . : .
CCDS44 PEQQEPGERQEPSMSWWPVSSAEKKKNIT-LDCARGTANCVVFSCPLYSFDRAAVLHVWG
830 840 850 860 870 880
940 950 960 970 980 990
pF1KE2 RVWNSTFIEDYRDFDRVRVNGWATLFLRTSIPTINMENKTTWFSVDIDSELVEELPAEIE
:.:::::.:.: ..: :.. ...:: .. ... .: . : . . . . .
CCDS44 RLWNSTFLEEYSAVKSLEVIVRANITVKSSIKNLMLRDASTVIPVMVYLDPMAVVAEGVP
890 900 910 920 930 940
1000 1010 1020 1030 1040
pF1KE2 LWLVLVAVGAGLLLLGLIILLLWKCGFFKRAR----TRALYEAKRQKAEMKSQPSETERL
:..:.:: ::::.:.:..::::: ::::::. : :.: . : ..: .:
CCDS44 WWVILLAVLAGLLVLALLVLLLWKMGFFKRAKHPEATVPQYHAVKIPREDRQQFKEEKTG
950 960 970 980 990 1000
1050
pF1KE2 TDDY
CCDS44 TILRNNWGSPRREGPDAHPILAADGHPELGPDGHPGPGTA
1010 1020 1030 1040
>>CCDS2292.1 ITGAV gene_id:3685|Hs108|chr2 (1048 aa)
initn: 600 init1: 158 opt: 948 Z-score: 1036.4 bits: 203.4 E(32554): 2.1e-51
Smith-Waterman score: 1107; 27.8% identity (55.3% similar) in 1107 aa overlap (9-1043:13-1040)
10 20 30 40 50
pF1KE2 MGPGPSRAPRAPRLMLCALALMVAAGGCVVSAFNLDTRFLVVKEAGNPGSLFGYSV
::. :.: .: : . : :::::. .. .: :: ::..:
CCDS22 MAFPPRRRLRLGPRGLPLLLSGLLLPL----C--RAFNLDVDS-PAEYSGPEGSYFGFAV
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 ALHRQTERQQRYLLLAGAPRELAVPDGYTNRTGAVYLCPLTAHKDDCERMNITV------
. . ..:..::.:::. .. : .. : : : .. . :. ... .
CCDS22 DFFVPSA-SSRMFLLVGAPKANTTQPGIVE-GGQVLKCDWSSTRR-CQPIEFDATGNRDY
60 70 80 90 100 110
120 130 140 150 160
pF1KE2 -KNDPGHHIIEDMWLGVTVASQGPAGRVLVCAHRYTQVLWSGSEDQRRM-VGKCYVRGND
:.:: .. .:.:..: :. ..:.:: : : :.: :: :...
CCDS22 AKDDP-LEFKSHQWFGASVRSK--QDKILACAPLYH---WRTEMKQEREPVGTCFLQ---
120 130 140 150 160
170 180 190 200 210 220
pF1KE2 LELDSSDDWQTYHNEMCNS-NTDYLETGMCQLGTSGGFTQ-NTVYFGAPGAYNWKGNSYM
: .: . : : . : :.:: : : ::. . : .:.::.. :.:.
CCDS22 ------DGTKTVEYAPCRSQDIDADGQGFCQGGFSIDFTKADRVLLGGPGSFYWQGQLIS
170 180 190 200 210
230 240 250 260 270
pF1KE2 IQRKE----WDLSEYSYKDPEDQG---------NLYIGYTMQVGSFILHPKNIT-IVTGA
: : .: . :: : .. . . :.::.. ::.: . .: .:.:.
CCDS22 DQVAEIVSKYDPNVYSIKYNNQLATRTAQAIFDDSYLGYSVAVGDF--NGDGIDDFVSGV
220 230 240 250 260 270
280 290 300 310 320 330
pF1KE2 PRH-RHMGAVFLLSQEAGGDLRRRQVLEGSQVGAYFGSAIALADLNNDGWQDLLVGAPYY
:: : .: :.. . : .. . : :..:::: ..: .:.:.: . :...::: .
CCDS22 PRAARTLGMVYIYD---GKNMSSLYNFTGEQMAAYFGFSVAATDINGDDYADVFIGAPLF
280 290 300 310 320 330
340 350 360 370 380
pF1KE2 FER----KEEVGGAIYVFMNQAGTSFPAHPSLLLHGPSGSA-FGLSVASIGDINQDGFQD
..: : . : . : ...:. .: . :.: : :: ..: .::..::::.:
CCDS22 MDRGSDGKLQEVGQVSVSLQRASGDFQ---TTKLNGFEVFARFGSAIAPLGDLDQDGFND
340 350 360 370 380
390 400 410 420 430 440
pF1KE2 IAVGAPFEGLGK---VYIYHSSSKGLLRQPQQVIHGEKLGLPGLATFGYSLSGQMDVDEN
::..::. : : :::... : :: :.:...:. . .::::..: :.:.:
CCDS22 IAIAAPYGGEDKKGIVYIFNGRSTGLNAVPSQILEGQWAARSMPPSFGYSMKGATDIDKN
390 400 410 420 430 440
450 460 470 480 490
pF1KE2 FYPDLLVGSLS-DHIVLLRARPVINIVHKTLVPRPAVL--DPALCT------ATSCVQVE
::::.::... :. .: ::::::. :. : :..: : :. .:: .:.
CCDS22 GYPDLIVGAFGVDRAILYRARPVIT-VNAGLEVYPSILNQDNKTCSLPGTALKVSCFNVR
450 460 470 480 490 500
500 510 520 530 540
pF1KE2 LCFAYNQSAGNPNYRRNITLAYTLEADRDRRPPRLR---FAGSESAVFHGFFSMPE---M
.:. .. :. :.... : :. .. .: : :.: ... . :
CCDS22 FCL---KADGKGVLPRKLNFQVELLLDKLKQKGAIRRALFLYSRSPSHSKNMTISRGGLM
510 520 530 540 550 560
550 560 570 580 590 600
pF1KE2 RCQKLELLLMDN--LRDKLRPIIISMNYSLPLRMPDRPRLGLRSLDAYPILNQAQALENH
.:..: : :. .:::: :: : :.: : : ::. ::::: .
CCDS22 QCEELIAYLRDESEFRDKLTPITIFMEYRLDYRTAA-DTTGLQ-----PILNQFTPANIS
570 580 590 600 610
610 620 630 640 650 660
pF1KE2 TEVQFQKECGPDNKCESNLQMRAAFVSEQQQKLSRLQYSRDVRKLLLSINVTNTRTSERS
.... .:: :: :. .:.. :. .:.:. : : : : ... : .
CCDS22 RQAHILLDCGEDNVCKPKLEVS---VDSDQKKI----YIGDDNPLTLIVKAQN------Q
620 630 640 650 660
670 680 690 700 710
pF1KE2 GEDAHEALLTLVVP-PALLLSSVRPPGA-----CQ---ANET--IFCELGNPFKRNQRME
:: :.:: : . .: : ... :: : : :.: . :.::::.: . ..
CCDS22 GEGAYEAELIVSIPLQADFIGVVRNNEALARLSCAFKTENQTRQVVCDLGNPMKAGTQLL
670 680 690 700 710 720
720 730 740 750 760 770
pF1KE2 LLITFEVIGVTLHTRDLQVQLQLSTSSHQDNLWPMILTLLVDYTLQTSLSM--VNHRLQS
. : : . ... .::...:. :.. :.. . :: .. ... . :. .
CCDS22 AGLRFSVHQQSEMDTSVKFDLQIQSSNLFDKVSPVV-SHKVDLAVLAAVEIRGVSSPDHV
730 740 750 760 770 780
780 790 800 810 820 830
pF1KE2 FFG-GTVMGESGMKTVEDVGSPLKYEFQVGPMGEGLVGLGTLVLGLEWPYEVSNGKWLLY
:. . . . .: :::: ... ... ..: ... .: :.:::. .:. :::
CCDS22 FLPIPNWEHKENPETEEDVGPVVQHIYEL--RNNGPSSFSKAMLHLQWPYKYNNNT-LLY
790 800 810 820 830 840
840 850 860 870 880 890
pF1KE2 PTEITVHGNGSWPCRPPGDL-INPLNLTLSDPGDRPSSPQRRRRQLDPGGGQGPPPVTLA
. . : : .:. :::: . .: : : ... : .::: ..
CCDS22 ILHYDIDG----PMNCTSDMEINPLRIKIS-------SLQTTEKN-DTVAGQGERDHLIT
850 860 870 880
900 910 920 930 940
pF1KE2 AAKKAKSE-TVLTCATGRAHCVWLECPIP--DAPVVTNVTVKARVWNSTFIEDYRDFDRV
: :: . : . : :.:. . : . : . . ::. .:. ::.. .
CCDS22 KRDLALSEGDIHTLGCGVAQCLKIVCQVGRLDRGKSAILYVKSLLWTETFMNKENQNHSY
890 900 910 920 930 940
950 960 970 980 990 1000
pF1KE2 RVNGWATL----FLRTSIPTINMENKTTWFSVDIDSELVEELPAEIELWLVLVAVGAGLL
... :.. : ..: .. : .: .... . .. : . .:....:: ::::
CCDS22 SLKSSASFNVIEFPYKNLPIEDITN-STLVTTNV-TWGIQPAPMPVPVWVIILAVLAGLL
950 960 970 980 990 1000
1010 1020 1030 1040 1050
pF1KE2 LLGLIILLLWKCGFFKRARTRALYEAKRQKAEMKSQPSETERLTDDY
::......... :::::.: .... . . :: :
CCDS22 LLAVLVFVMYRMGFFKRVRP-----PQEEQEREQLQPHENGEGNSET
1010 1020 1030 1040
>>CCDS46471.1 ITGAV gene_id:3685|Hs108|chr2 (1002 aa)
initn: 557 init1: 158 opt: 901 Z-score: 985.0 bits: 193.8 E(32554): 1.5e-48
Smith-Waterman score: 1060; 27.6% identity (55.3% similar) in 1049 aa overlap (67-1043:17-994)
40 50 60 70 80 90
pF1KE2 TRFLVVKEAGNPGSLFGYSVALHRQTERQQRYLLLAGAPRELAVPDGYTNRTGAVYLCPL
:..::.:::. .. : .. : : :
CCDS46 MLLGTLLLILYILMLCRMFLLVGAPKANTTQPGIVE-GGQVLKCDW
10 20 30 40
100 110 120 130 140
pF1KE2 TAHKDDCERMNITV-------KNDPGHHIIEDMWLGVTVASQGPAGRVLVCAHRYTQVLW
.. . :. ... . :.:: .. .:.:..: :. ..:.:: : :
CCDS46 SSTRR-CQPIEFDATGNRDYAKDDP-LEFKSHQWFGASVRSK--QDKILACAPLYH---W
50 60 70 80 90
150 160 170 180 190 200
pF1KE2 SGSEDQRRM-VGKCYVRGNDLELDSSDDWQTYHNEMCNS-NTDYLETGMCQLGTSGGFTQ
:.: :: :... : .: . : : . : :.:: : : ::.
CCDS46 RTEMKQEREPVGTCFLQ---------DGTKTVEYAPCRSQDIDADGQGFCQGGFSIDFTK
100 110 120 130 140
210 220 230 240 250
pF1KE2 -NTVYFGAPGAYNWKGNSYMIQRKE----WDLSEYSYKDPEDQG---------NLYIGYT
. : .:.::.. :.:. : : .: . :: : .. . . :.::.
CCDS46 ADRVLLGGPGSFYWQGQLISDQVAEIVSKYDPNVYSIKYNNQLATRTAQAIFDDSYLGYS
150 160 170 180 190 200
260 270 280 290 300 310
pF1KE2 MQVGSFILHPKNIT-IVTGAPRH-RHMGAVFLLSQEAGGDLRRRQVLEGSQVGAYFGSAI
. ::.: . .: .:.:.:: : .: :.. . : .. . : :..:::: ..
CCDS46 VAVGDF--NGDGIDDFVSGVPRAARTLGMVYIYD---GKNMSSLYNFTGEQMAAYFGFSV
210 220 230 240 250 260
320 330 340 350 360
pF1KE2 ALADLNNDGWQDLLVGAPYYFER----KEEVGGAIYVFMNQAGTSFPAHPSLLLHGPSGS
: .:.:.: . :...::: ...: : . : . : ...:. .: . :.:
CCDS46 AATDINGDDYADVFIGAPLFMDRGSDGKLQEVGQVSVSLQRASGDFQ---TTKLNGFEVF
270 280 290 300 310 320
370 380 390 400 410 420
pF1KE2 A-FGLSVASIGDINQDGFQDIAVGAPFEGLGK---VYIYHSSSKGLLRQPQQVIHGEKLG
: :: ..: .::..::::.:::..::. : : :::... : :: :.:...:. .
CCDS46 ARFGSAIAPLGDLDQDGFNDIAIAAPYGGEDKKGIVYIFNGRSTGLNAVPSQILEGQWAA
330 340 350 360 370 380
430 440 450 460 470 480
pF1KE2 LPGLATFGYSLSGQMDVDENFYPDLLVGSLS-DHIVLLRARPVINIVHKTLVPRPAVL--
.::::..: :.:.: ::::.::... :. .: ::::::. :. : :..:
CCDS46 RSMPPSFGYSMKGATDIDKNGYPDLIVGAFGVDRAILYRARPVIT-VNAGLEVYPSILNQ
390 400 410 420 430 440
490 500 510 520 530
pF1KE2 DPALCT------ATSCVQVELCFAYNQSAGNPNYRRNITLAYTLEADRDRRPPRLR---F
: :. .:: .:..:. .. :. :.... : :. .. .: :
CCDS46 DNKTCSLPGTALKVSCFNVRFCL---KADGKGVLPRKLNFQVELLLDKLKQKGAIRRALF
450 460 470 480 490
540 550 560 570 580
pF1KE2 AGSESAVFHGFFSMPE---MRCQKLELLLMDN--LRDKLRPIIISMNYSLPLRMPDRPRL
:.: ... . :.:..: : :. .:::: :: : :.: : :
CCDS46 LYSRSPSHSKNMTISRGGLMQCEELIAYLRDESEFRDKLTPITIFMEYRLDYRTAA-DTT
500 510 520 530 540 550
590 600 610 620 630 640
pF1KE2 GLRSLDAYPILNQAQALENHTEVQFQKECGPDNKCESNLQMRAAFVSEQQQKLSRLQYSR
::. ::::: . .... .:: :: :. .:.. :. .:.:. :
CCDS46 GLQ-----PILNQFTPANISRQAHILLDCGEDNVCKPKLEVS---VDSDQKKI----YIG
560 570 580 590 600
650 660 670 680 690
pF1KE2 DVRKLLLSINVTNTRTSERSGEDAHEALLTLVVP-PALLLSSVRPPGA-----CQ---AN
: : : ... : .:: :.:: : . .: : ... :: : : :
CCDS46 DDNPLTLIVKAQN------QGEGAYEAELIVSIPLQADFIGVVRNNEALARLSCAFKTEN
610 620 630 640 650
700 710 720 730 740 750
pF1KE2 ET--IFCELGNPFKRNQRMELLITFEVIGVTLHTRDLQVQLQLSTSSHQDNLWPMILTLL
.: . :.::::.: . .. . : : . ... .::...:. :.. : ...
CCDS46 QTRQVVCDLGNPMKAGTQLLAGLRFSVHQQSEMDTSVKFDLQIQSSNLFDKVSP-VVSHK
660 670 680 690 700 710
760 770 780 790 800 810
pF1KE2 VDYTLQTSLSM--VNHRLQSFFG-GTVMGESGMKTVEDVGSPLKYEFQVGPMGEGLVGLG
:: .. ... . :. . :. . . . .: :::: ... ... ..: ...
CCDS46 VDLAVLAAVEIRGVSSPDHVFLPIPNWEHKENPETEEDVGPVVQHIYEL--RNNGPSSFS
720 730 740 750 760 770
820 830 840 850 860 870
pF1KE2 TLVLGLEWPYEVSNGKWLLYPTEITVHGNGSWPCRPPGDL-INPLNLTLSDPGDRPSSPQ
.: :.:::. .:. ::: . . : : .:. :::: . .: : :
CCDS46 KAMLHLQWPYKYNNNT-LLYILHYDIDG----PMNCTSDMEINPLRIKIS-------SLQ
780 790 800 810 820
880 890 900 910 920
pF1KE2 RRRRQLDPGGGQGPPPVTLAAAKKAKSE-TVLTCATGRAHCVWLECPIP--DAPVVTNVT
... : .::: .. : :: . : . : :.:. . : . : . .
CCDS46 TTEKN-DTVAGQGERDHLITKRDLALSEGDIHTLGCGVAQCLKIVCQVGRLDRGKSAILY
830 840 850 860 870 880
930 940 950 960 970 980
pF1KE2 VKARVWNSTFIEDYRDFDRVRVNGWATL----FLRTSIPTINMENKTTWFSVDIDSELVE
::. .:. ::.. . ... :.. : ..: .. : .: .... . ..
CCDS46 VKSLLWTETFMNKENQNHSYSLKSSASFNVIEFPYKNLPIEDITN-STLVTTNV-TWGIQ
890 900 910 920 930 940
990 1000 1010 1020 1030 1040
pF1KE2 ELPAEIELWLVLVAVGAGLLLLGLIILLLWKCGFFKRARTRALYEAKRQKAEMKSQPSET
: . .:....:: ::::::......... :::::.: .... . . :: :
CCDS46 PAPMPVPVWVIILAVLAGLLLLAVLVFVMYRMGFFKRVRP-----PQEEQEREQLQPHEN
950 960 970 980 990
1050
pF1KE2 ERLTDDY
CCDS46 GEGNSET
1000
>>CCDS31155.1 ITGA8 gene_id:8516|Hs108|chr10 (1063 aa)
initn: 779 init1: 157 opt: 863 Z-score: 942.8 bits: 186.1 E(32554): 3.4e-46
Smith-Waterman score: 1194; 28.0% identity (55.8% similar) in 1102 aa overlap (1-1023:1-1043)
10 20 30 40 50
pF1KE2 MGPGPSRAPR---APRLM-LC----ALALMVAAGGCVVSAFNLDTRFLVVKEAGNPGSLF
:.:: ::.:: :: . :: ::.... . .: .:::::.. :.: .: :: :
CCDS31 MSPGASRGPRGSQAPLIAPLCCAAAALGMLLWSPAC--QAFNLDVEKLTVY-SGPKGSYF
10 20 30 40 50
60 70 80 90 100
pF1KE2 GYSVALHRQTERQQRYLLLAGAPR-ELAVPDGYTNRTGAVYLCPLTAHKD-DCERM----
::.: .: : .:.:::. . . :: . :::: :: :. . .:...
CCDS31 GYAVDFHIPDARTAS--VLVGAPKANTSQPD--IVEGGAVYYCPWPAEGSAQCRQIPFDT
60 70 80 90 100 110
110 120 130 140 150 160
pF1KE2 --NITVKNDPGHHIIE---DMWLGVTVASQGPAGRVLVCAHRYTQVLWSGSEDQRRMVGK
: .. . .. :: ..:.:.:: .. :.:..:: : . . . . ::
CCDS31 TNNRKIRVNGTKEPIEFKSNQWFGATVKAH--KGKVVACAPLYHWRTLKPTPE-KDPVGT
120 130 140 150 160 170
170 180 190 200 210
pF1KE2 CYVRGNDLELDSSDDWQTYHN-EMC-NSNTDYLETGMCQLGTSGGFTQN-TVYFGAPGAY
::: . .....: . : :::.: :.:: : : : .: . :.::..
CCDS31 CYV--------AIQNFSAYAEFSPCRNSNADPEGQGYCQAGFSLDFYKNGDLIVGGPGSF
180 190 200 210 220
220 230 240 250 260
pF1KE2 NWKGNSYMIQRKEWDL-SEYSYKD--------------PEDQGNLYIGYTMQVGSFILHP
:.:. .: . :. ..::.:: : . . :.::.. .: :
CCDS31 YWQGQ--VITASVADIIANYSFKDILRKLAGEKQTEVAPASYDDSYLGYSVAAGEFTGDS
230 240 250 260 270 280
270 280 290 300 310 320
pF1KE2 KNITIVTGAPRH-RHMGAVFLLSQEAGGDLRRRQVLEGSQVGAYFGSAIALADLNNDGWQ
.. .:.: :: ...: : .... :. : . : :...::: .....:.:.:: .
CCDS31 QQ-ELVAGIPRGAQNFGYVSIINST---DMTFIQNFTGEQMASYFGYTVVVSDVNSDGLD
290 300 310 320 330
330 340 350 360 370
pF1KE2 DLLVGAPYYFERKEEVG----GAIYVFMNQAGTSFPAHPSLLLHGPSGSAFGLSVASIGD
:.::::: ..::. : . : ::... :... . :..: . . :: ..: .::
CCDS31 DVLVGAPLFMEREFESNPREVGQIYLYL-QVSSLLFRDPQILTGTETFGRFGSAMAHLGD
340 350 360 370 380 390
380 390 400 410 420 430
pF1KE2 INQDGFQDIAVGAPFEGL---GKVYIYHSSSKGLLRQPQQVIHGEKLGLPGLATFGYSLS
.::::..:::.:.:: : ::: ::.... :: .:.::..: . . ::..:
CCDS31 LNQDGYNDIAIGVPFAGKDQRGKVLIYNGNKDGLNTKPSQVLQGVWASHAVPSGFGFTLR
400 410 420 430 440 450
440 450 460 470 480 490
pF1KE2 GQMDVDENFYPDLLVGSL-SDHIVLLRARPVINIVHKTLV-PRPAVLDPALCTATSCVQV
:. :.:.: ::::.::.. . .... :::::... . :. : :. : . . .
CCDS31 GDSDIDKNDYPDLIVGAFGTGKVAVYRARPVVTVDAQLLLHPMIINLENKTCQVPDSMTS
460 470 480 490 500 510
500 510 520 530 540
pF1KE2 ELCFAYN--QSAGNPNYRRNITLAYTLEADRDRRP---PRLRFAGSESAVFHGFFSMPEM
::. :. . . .:.: .. : .. : : ...: : : .
CCDS31 AACFSLRVCASVTGQSIANTIVLMAEVQLDSLKQKGAIKRTLFLDNHQA--HRVFPLVIK
520 530 540 550 560 570
550 560 570 580 590 600
pF1KE2 R-----CQKLELLLMDN--LRDKLRPIIISMNYSLPLRMPDRPRLGLRSLDAYPILNQAQ
: :: . . : :. .:::: :: ::.:::: :. . ..:.. :::: .
CCDS31 RQKSHQCQDFIVYLRDETEFRDKLSPINISLNYSL-----DESTFK-EGLEVKPILNYYR
580 590 600 610 620
610 620 630 640 650 660
pF1KE2 ALENHTEVQFQKECGPDNKCESNLQMRAAFVSEQQQKLSRLQYSRDVRKLLLSINVTNTR
.... .:: :: : .:.. : ...: . : .:.: ::. :
CCDS31 ENIVSEQAHILVDCGEDNLCVPDLKLSAR--PDKHQVIIG-----DENHLMLIINARNE-
630 640 650 660 670
670 680 690 700 710
pF1KE2 TSERSGEDAHEALLTLVVPPALLLSSVRP------PGACQ-----ANETIFCELGNPFKR
:: :.:: : ...: ... : .:. ... . :.::::.
CCDS31 -----GEGAYEAELFVMIPEEADYVGIERNNKGFRPLSCEYKMENVTRMVVCDLGNPMVS
680 690 700 710 720 730
720 730 740 750 760
pF1KE2 NQRMELLITFEVIGVTLHTRDLQVQLQLSTSSHQDNLWPMILTLLVDYTL--QTSLSMVN
. . : . : : . . ... .::. ::..:: ...: .. : :. . :.
CCDS31 GTNYSLGLRFAVPRLEKTNMSINFDLQIR-SSNKDNPDSNFVSLQINITAVAQVEIRGVS
740 750 760 770 780 790
770 780 790 800 810 820
pF1KE2 HRLQSFFG-GTVMGESGMKTVEDVGSPLKYEFQVGPMGEGLVGLGTLVLGLEWPYEVSNG
: : . . : . :.:: ... ... .: . .. : .: ::. . .
CCDS31 HPPQIVLPIHNWEPEEEPHKEEEVGPLVEHIYELHNIGPSTISDTILEVG--WPFSARD-
800 810 820 830 840 850
830 840 850 860 870 880
pF1KE2 KWLLYPTEITVHGNGSWPCRPPGDLINPLNLT-LSDPGDRPSSPQRRRRQLDPGGGQGPP
..::: .: . : :.: . ::: .. ..: : : : . : .
CCDS31 EFLLYIFHIQTL--GPLQCQPNPN-INPQDIKPAASPEDTPELSAFLRNSTIPHLVR-KR
860 870 880 890 900
890 900 910 920 930 940
pF1KE2 PVTLAAAKKAKSETVLTCATGRAHCVWLECPIP--DAPVVTNVTVKARVWNSTFIEDYRD
: .. .. . .:.:.. .:. . : . .. . . :..:.: ::.. :
CCDS31 DVHVVEFHRQSPAKILNCTN--IECLQISCAVGRLEGGESAVLKVRSRLWAHTFLQ--RK
910 920 930 940 950 960
950 960 970 980 990 1000
pF1KE2 FDRVRVNGWATLFLRTSIPTINMENKTTWFSVDIDSELVEELPA---EIELWLVLVAVGA
: . . ... .. ..: .. : :. : . .. : : ::....:.
CCDS31 NDPYALASLVSFEVK-KMPYTDQPAKLPEGSIVIKTSVIWATPNVSFSIPLWVIILAILL
970 980 990 1000 1010 1020
1010 1020 1030 1040 1050
pF1KE2 GLLLLGLIILLLWKCGFFKRARTRALYEAKRQKAEMKSQPSETERLTDDY
:::.:... : ::::::: :::
CCDS31 GLLVLAILTLALWKCGFFDRARPPQEDMTDREQLTNDKTPEA
1030 1040 1050 1060
>>CCDS46470.1 ITGAV gene_id:3685|Hs108|chr2 (1012 aa)
initn: 600 init1: 158 opt: 847 Z-score: 925.5 bits: 182.9 E(32554): 3.1e-45
Smith-Waterman score: 1019; 27.2% identity (54.6% similar) in 1092 aa overlap (9-1043:13-1004)
10 20 30 40 50
pF1KE2 MGPGPSRAPRAPRLMLCALALMVAAGGCVVSAFNLDTRFLVVKEAGNPGSLFGYSV
::. :.: .: : . : :::::. .. .: :: ::..:
CCDS46 MAFPPRRRLRLGPRGLPLLLSGLLLPL----C--RAFNLDVDS-PAEYSGPEGSYFGFAV
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 ALHRQTERQQRYLLLAGAPRELAVPDGYTNRTGAVYLCPLTAHKDDCERMNITV------
. . ..:..::.:::. .. : .. : : : .. . :. ... .
CCDS46 DFFVPSA-SSRMFLLVGAPKANTTQPGIVE-GGQVLKCDWSSTRR-CQPIEFDATGNRDY
60 70 80 90 100 110
120 130 140 150 160
pF1KE2 -KNDPGHHIIEDMWLGVTVASQGPAGRVLVCAHRYTQVLWSGSEDQRRM-VGKCYVRGND
:.:: .. .:.:..: :. ..:.:: : : :.: :: :...
CCDS46 AKDDP-LEFKSHQWFGASVRSK--QDKILACAPLYH---WRTEMKQEREPVGTCFLQ---
120 130 140 150 160
170 180 190 200 210 220
pF1KE2 LELDSSDDWQTYHNEMCNSNTDYLETGMCQLGTSGGFTQNTVYFGAPGAYNWKGNSYMIQ
: .: . : : :: : .. . . :..:. : :. .
CCDS46 ------DGTKTVEYAPCRSR---------QL-ISDQVAEIVSKYD-PNVYSIKYNNQLAT
170 180 190 200
230 240 250 260 270 280
pF1KE2 RKEWDLSEYSYKDPEDQGNLYIGYTMQVGSFILHPKNIT-IVTGAPRH-RHMGAVFLLSQ
: . . :: .::.. ::.: . .: .:.:.:: : .: :.. .
CCDS46 RTAQAIFDDSY----------LGYSVAVGDF--NGDGIDDFVSGVPRAARTLGMVYIYD-
210 220 230 240 250
290 300 310 320 330 340
pF1KE2 EAGGDLRRRQVLEGSQVGAYFGSAIALADLNNDGWQDLLVGAPYYFER----KEEVGGAI
: .. . : :..:::: ..: .:.:.: . :...::: ...: : . : .
CCDS46 --GKNMSSLYNFTGEQMAAYFGFSVAATDINGDDYADVFIGAPLFMDRGSDGKLQEVGQV
260 270 280 290 300
350 360 370 380 390
pF1KE2 YVFMNQAGTSFPAHPSLLLHGPSGSA-FGLSVASIGDINQDGFQDIAVGAPFEGLGK---
: ...:. .: . :.: : :: ..: .::..::::.:::..::. : :
CCDS46 SVSLQRASGDFQ---TTKLNGFEVFARFGSAIAPLGDLDQDGFNDIAIAAPYGGEDKKGI
310 320 330 340 350 360
400 410 420 430 440 450
pF1KE2 VYIYHSSSKGLLRQPQQVIHGEKLGLPGLATFGYSLSGQMDVDENFYPDLLVGSLS-DHI
:::... : :: :.:...:. . .::::..: :.:.: ::::.::... :.
CCDS46 VYIFNGRSTGLNAVPSQILEGQWAARSMPPSFGYSMKGATDIDKNGYPDLIVGAFGVDRA
370 380 390 400 410 420
460 470 480 490 500
pF1KE2 VLLRARPVINIVHKTLVPRPAVL--DPALCT------ATSCVQVELCFAYNQSAGNPNYR
.: ::::::. :. : :..: : :. .:: .:..:. .. :.
CCDS46 ILYRARPVIT-VNAGLEVYPSILNQDNKTCSLPGTALKVSCFNVRFCL---KADGKGVLP
430 440 450 460 470 480
510 520 530 540 550 560
pF1KE2 RNITLAYTLEADRDRRPPRLR---FAGSESAVFHGFFSMPE---MRCQKLELLLMDN--L
:.... : :. .. .: : :.: ... . :.:..: : :. .
CCDS46 RKLNFQVELLLDKLKQKGAIRRALFLYSRSPSHSKNMTISRGGLMQCEELIAYLRDESEF
490 500 510 520 530 540
570 580 590 600 610 620
pF1KE2 RDKLRPIIISMNYSLPLRMPDRPRLGLRSLDAYPILNQAQALENHTEVQFQKECGPDNKC
:::: :: : :.: : : ::. ::::: . .... .:: :: :
CCDS46 RDKLTPITIFMEYRLDYRTAA-DTTGLQ-----PILNQFTPANISRQAHILLDCGEDNVC
550 560 570 580 590
630 640 650 660 670 680
pF1KE2 ESNLQMRAAFVSEQQQKLSRLQYSRDVRKLLLSINVTNTRTSERSGEDAHEALLTLVVP-
. .:.. :. .:.:. : : : : ... : .:: :.:: : . .:
CCDS46 KPKLEVS---VDSDQKKI----YIGDDNPLTLIVKAQN------QGEGAYEAELIVSIPL
600 610 620 630 640
690 700 710 720 730
pF1KE2 PALLLSSVRPPGA-----CQ---ANET--IFCELGNPFKRNQRMELLITFEVIGVTLHTR
: ... :: : : :.: . :.::::.: . .. . : : .
CCDS46 QADFIGVVRNNEALARLSCAFKTENQTRQVVCDLGNPMKAGTQLLAGLRFSVHQQSEMDT
650 660 670 680 690 700
740 750 760 770 780
pF1KE2 DLQVQLQLSTSSHQDNLWPMILTLLVDYTLQTSLSM--VNHRLQSFFG-GTVMGESGMKT
... .::...:. :.. :.. . :: .. ... . :. . :. . . . .:
CCDS46 SVKFDLQIQSSNLFDKVSPVV-SHKVDLAVLAAVEIRGVSSPDHVFLPIPNWEHKENPET
710 720 730 740 750 760
790 800 810 820 830 840
pF1KE2 VEDVGSPLKYEFQVGPMGEGLVGLGTLVLGLEWPYEVSNGKWLLYPTEITVHGNGSWPCR
:::: ... ... ..: ... .: :.:::. .:. ::: . . : :
CCDS46 EEDVGPVVQHIYEL--RNNGPSSFSKAMLHLQWPYKYNNNT-LLYILHYDIDG----PMN
770 780 790 800 810
850 860 870 880 890 900
pF1KE2 PPGDL-INPLNLTLSDPGDRPSSPQRRRRQLDPGGGQGPPPVTLAAAKKAKSE-TVLTCA
.:. :::: . .: : : ... : .::: .. : :: . : .
CCDS46 CTSDMEINPLRIKIS-------SLQTTEKN-DTVAGQGERDHLITKRDLALSEGDIHTLG
820 830 840 850 860
910 920 930 940 950
pF1KE2 TGRAHCVWLECPIP--DAPVVTNVTVKARVWNSTFIEDYRDFDRVRVNGWATL----FLR
: :.:. . : . : . . ::. .:. ::.. . ... :.. :
CCDS46 CGVAQCLKIVCQVGRLDRGKSAILYVKSLLWTETFMNKENQNHSYSLKSSASFNVIEFPY
870 880 890 900 910 920
960 970 980 990 1000 1010
pF1KE2 TSIPTINMENKTTWFSVDIDSELVEELPAEIELWLVLVAVGAGLLLLGLIILLLWKCGFF
..: .. : .: .... . .. : . .:....:: ::::::......... :::
CCDS46 KNLPIEDITN-STLVTTNV-TWGIQPAPMPVPVWVIILAVLAGLLLLAVLVFVMYRMGFF
930 940 950 960 970 980
1020 1030 1040 1050
pF1KE2 KRARTRALYEAKRQKAEMKSQPSETERLTDDY
::.: .... . . :: :
CCDS46 KRVRP-----PQEEQEREQLQPHENGEGNSET
990 1000 1010
>>CCDS32665.1 ITGA2B gene_id:3674|Hs108|chr17 (1039 aa)
initn: 589 init1: 169 opt: 722 Z-score: 787.8 bits: 157.4 E(32554): 1.5e-37
Smith-Waterman score: 1086; 28.8% identity (56.5% similar) in 1093 aa overlap (21-1023:17-1028)
10 20 30 40 50
pF1KE2 MGPGPSRAPRAPRLMLCALALMVAAGGCVVS---AFNLDTRFLVVKEAGNPGSLFGYSVA
... : :.. :.::: :. :: :: ::.:.
CCDS32 MARALCPLQALWLLEWVLLLLGPCAAPPAWALNLDPVQLTFY-AGPNGSQFGFSLD
10 20 30 40 50
60 70 80 90 100 110
pF1KE2 LHRQTERQQRYLLLAGAPRELAVPDGYTNRTGAVYLCPLTAHKDDCERMNITVKNDP---
.:... . : ...:::: :. :. ..::.:.::: :. .: . . ....
CCDS32 FHKDS--HGRVAIVVGAPRTLG-PS--QEETGGVFLCPWRAEGGQCPSLLFDLRDETRNV
60 70 80 90 100 110
120 130 140 150 160
pF1KE2 GHHIIEDMW----LGVTVASQGPAGRVLVCAH-RYTQVLWSGSEDQRRMVGKCYVRGNDL
: . .. . ::..:.: . . ...:: .. .:: . : .. ::.:.
CCDS32 GSQTLQTFKARQGLGASVVSWSDV--IVACAPWQHWNVLEKTEEAEKTPVGSCF------
120 130 140 150 160
170 180 190 200 210
pF1KE2 ELDSSDDWQTYHNEMCNSNTD---YLETGM------CQLGTSGGFTQ-NTVYFGAPGAYN
: . .. . . : .:: :.:. . :. : :. :: . . .::::.:
CCDS32 -LAQPESGRRAEYSPCRGNTLSRIYVENDFSWDKRYCEAGFSSVVTQAGELVLGAPGGYY
170 180 190 200 210 220
220 230 240 250 260
pF1KE2 WKG-----------NSYMIQRKEWDLSEYSYK----DPEDQGNLYIGYTMQVGSFILHPK
. : .:: : .: : . .:: . : ::.. :: : .
CCDS32 FLGLLAQAPVADIFSSYRPGILLWHVSSQSLSFDSSNPE-YFDGYWGYSVAVGEFDGDLN
230 240 250 260 270 280
270 280 290 300 310 320
pF1KE2 NITIVTGAPRHR-HMGAVFLLSQEAGGDLRRRQVLEGSQVGAYFGSAIALADLNNDGWQD
. :.::: .::: .:.. .: . :.: :...::: ..:..:.:.:: .:
CCDS32 TTEYVVGAPTWSWTLGAVEILDSY----YQRLHRLRGEQMASYFGHSVAVTDVNGDGRHD
290 300 310 320 330
330 340 350 360 370
pF1KE2 LLVGAPYYFE----RKEEVGGAIYVFMNQAGTSFPAHPSLLLHGPS-GSAFGLSVASIGD
:::::: :.: :: : .:.:.. : . ::::: : . . :: ..: .::
CCDS32 LLVGAPLYMESRADRKLAEVGRVYLFLQPRGPHALGAPSLLLTGTQLYGRFGSAIAPLGD
340 350 360 370 380 390
380 390 400 410 420 430
pF1KE2 INQDGFQDIAVGAPF---EGLGKVYIYHSSSKGLLRQPQQVIHGEKLGLPGLATFGYSLS
...::..::::.::. : :.: .. ..:.:: .:.::. . .: ..::.::
CCDS32 LDRDGYNDIAVAAPYGGPSGRGQVLVFLGQSEGLRSRPSQVLDSP---FPTGSAFGFSLR
400 410 420 430 440 450
440 450 460 470 480
pF1KE2 GQMDVDENFYPDLLVGSL-SDHIVLLRARPVINIVHKTLVP---RPAVLD---PALCTAT
: .:.:.: ::::.::. ...... ::.::.. . :: ::: . : : .
CCDS32 GAVDIDDNGYPDLIVGAYGANQVAVYRAQPVVKASVQLLVQDSLNPAVKSCVLPQTKTPV
460 470 480 490 500 510
490 500 510 520 530 540
pF1KE2 SCVQVELCFAYNQSAGNPNYRRNITLAYTLEADRD--RRPPRLRFAGSESAVFHGFFSMP
:: ....: .: . : ....: :. ::. :. :. . ::..: ...
CCDS32 SCFNIQMCV----GATGHNIPQKLSLNAELQLDRQKPRQGRRVLLLGSQQAGTTLNLDLG
520 530 540 550 560
550 560 570 580 590 600
pF1KE2 EMR---CQKLELLLMD--NLRDKLRPIIISMNYSLPLRMPDRPRLGLRSLDAYPILNQAQ
. :. .: : ..:::: ::..:.: ::: : . .. : :
CCDS32 GKHSPICHTTMAFLRDEADFRDKLSPIVLSLNVSLP---PTEAGMA-------P----AV
570 580 590 600 610
610 620 630 640 650
pF1KE2 ALENHTEVQFQK----ECGPDNKCESNLQMRAAFVSEQQQKLSRLQYSRDVRKLLLSINV
.:.. :.:: : .:: :. : .::. :. .. : : . : : :....
CCDS32 VLHGDTHVQEQTRIVLDCGEDDVCVPQLQLTASVTG------SPLLVGAD-NVLELQMDA
620 630 640 650 660
660 670 680 690 700
pF1KE2 TNTRTSERSGEDAHEALLTLVVPPAL----LLSSVR--PPGAC---QANET--IFCELGN
.: :: :.:: :.. .: . ::.:. : . ::: ..:::::
CCDS32 ANE------GEGAYEAELAVHLPQGAHYMRALSNVEGFERLICNQKKENETRVVLCELGN
670 680 690 700 710 720
710 720 730 740 750 760
pF1KE2 PFKRNQRMELLITFEVIGVTLHTRDLQVQLQLSTSSHQDNLWPMILTLLVDYTLQTSLSM
:.:.: .. . . : .. .... :::. ... :. : .:.: ... ..
CCDS32 PMKKNAQIGIAMLVSVGNLEEAGESVSFQLQIRSKNSQN---PNSKIVLLDVPVRAE-AQ
730 740 750 760 770
770 780 790 800 810 820
pF1KE2 VNHRLQSFFGGTVM----GESGMKTVEDVGSPLKYEFQVGPMGEGLVGLGTLVLGLEWPY
:. : .:: .. :. :: ...... : ... ... : : :. : : :... :
CCDS32 VELRGNSFPASLVVAAEEGEREQNSLDSWGPKVEHTYELHNNGPGTVN-G-LHLSIHLPG
780 790 800 810 820 830
830 840 850 860 870
pF1KE2 EVSNGKWLLYPTEITVHGNGSWPC--RPPGDLINPLNLT--LSDPGDRPSSP---QRRRR
. :. . ::: .: . .:. : .:: .:::.. : :. : : .: ::
CCDS32 Q-SQPSDLLYILDI--QPQGGLQCFPQPP---VNPLKVDWGLPIPSPSPIHPAHHKRDRR
840 850 860 870 880 890
880 890 900 910 920 930
pF1KE2 QLDPGGGQGPPPVTLAAAKKAKSETVLTCATGRAHCVWLECPIPDAPV--VTNVTVKARV
:. : : .. .. ....: . : :. ..: . . . ::: : .
CCDS32 QI-----FLPEP---EQPSRLQDPVLVSCDS--APCTVVQCDLQEMARGQRAMVTVLAFL
900 910 920 930 940
940 950 960 970 980 990
pF1KE2 WNSTFIEDYRDFDR--VRVNGWATLFLRTSIPTINMENKTTWFSVDIDSELVEELPAE-I
: .. . : .:. .. ..: : .:.: . ... ..:.. : . :
CCDS32 WLPSLYQ--RPLDQFVLQSHAW---FNVSSLPYAVPPLSLPRGEAQVWTQLLRALEERAI
950 960 970 980 990
1000 1010 1020 1030 1040 1050
pF1KE2 ELWLVLVAVGAGLLLLGLIILLLWKCGFFKRARTRALYEAKRQKAEMKSQPSETERLTDD
.: :::.: .::::: ...: .:: ::::: :
CCDS32 PIWWVLVGVLGGLLLLTILVLAMWKVGFFKRNRPPLEEDDEEGE
1000 1010 1020 1030
pF1KE2 Y
>>CCDS32433.1 ITGAL gene_id:3683|Hs108|chr16 (1170 aa)
initn: 361 init1: 195 opt: 679 Z-score: 739.8 bits: 148.7 E(32554): 6.9e-35
Smith-Waterman score: 679; 28.7% identity (58.5% similar) in 557 aa overlap (200-723:353-883)
170 180 190 200 210 220
pF1KE2 ELDSSDDWQTYHNEMCNSNTDYLETGMCQLGTSGGFTQNTVYFGAPGAYNWKGNSYMIQR
: :. .... . :: :: .: :. ..
CCDS32 LFTELQKKIYVIEGTSKQDLTSFNMELSSSGISADLSRGHAVVGAVGAKDWAGGFLDLKA
330 340 350 360 370 380
230 240 250 260 270 280
pF1KE2 KEWDLSEYSYKD--PEDQGNLYIGYTMQVGSFILHPKNITIVTGAPRHRHMGAVFLLSQ-
: . . . :: ... :.::: : . . :. ...::::..::: :.:...
CCDS32 DLQDDTFIGNEPLTPEVRAG-YLGYT--VTWLPSRQKTSLLASGAPRYQHMGRVLLFQEP
390 400 410 420 430
290 300 310 320 330 340
pF1KE2 EAGGDLRRRQVLEGSQVGAYFGSAIALADLNNDGWQDLL-VGAPYYFERKEEVGGAIYVF
..:: . :...:.:.:.:::. . .:...:: .:: .::: .. :. :: ....
CCDS32 QGGGHWSQVQTIHGTQIGSYFGGELCGVDVDQDGETELLLIGAPLFY--GEQRGGRVFIY
440 450 460 470 480 490
350 360 370 380 390 400
pF1KE2 MN-QAGTSFPAHPSLLLHGPSG---SAFGLSVASIGDINQDGFQDIAVGAPFEGLGKVYI
. : : .. :.: : . :: ..... ::: ::. :.:::::.: : :::
CCDS32 QRRQLGFEEVSE----LQGDPGYPLGRFGEAITALTDINGDGLVDVAVGAPLEEQGAVYI
500 510 520 530 540 550
410 420 430 440 450 460
pF1KE2 YHSSSKGLLRQPQQVIHGEKLGLPGLATFGYSLSGQMDVDENFYPDLLVGSLSDHIVLLR
... :: ::.: :.: .. : :. :: :. : :.. . :. ::. :. :::
CCDS32 FNGRHGGLSPQPSQRIEGTQV-LSGIQWFGRSIHGVKDLEGDGLADVAVGAESQMIVL-S
560 570 580 590 600 610
470 480 490 500 510
pF1KE2 ARPVINIVH-KTLVPRPAVLDPALCTATSC------VQVELCFAYNQSAGNPNYRRNITL
.:::...: .. : . . :. .. :.. .:: .. . . : .:
CCDS32 SRPVVDMVTLMSFSPAEIPVHEVECSYSTSNKMKEGVNITICFQIKSLIPQFQGRLVANL
620 630 640 650 660 670
520 530 540 550 560 570
pF1KE2 AYTLEADRDRRPPRLRFAGSESAVFHGFFSMPEMRCQKLELLLMDNLRDKLRPIIISMNY
.:::. : : : : :.. . ... : : . . . ..: . :: .:.:.
CCDS32 TYTLQLDGHRTRRRGLFPGGRHELRRNIAVTTSMSCTDFSFHFPVCVQDLISPINVSLNF
680 690 700 710 720 730
580 590 600 610 620 630
pF1KE2 SLPLRMPDRPR-LGLRSLDAYPILNQAQALENHT-EVQFQKECGPDNKCESNLQMRAAFV
:: . :: .. : ::: . :...: :. :.:.:: :.:::.:: :..:
CCDS32 SL-WEEEGTPRDQRAQGKDIPPILRPS--LHSETWEIPFEKNCGEDKKCEANL--RVSFS
740 750 760 770 780
640 650 660 670 680
pF1KE2 SEQQQKLSRLQYSRDVRKLLLSINVTNTRTSERSGEDAHEALLTLVVPPALLLSSV---R
... : .. .: . ....: . :::. . : : ::.: . .: .
CCDS32 PARSRALRLTAFA----SLSVELSLSNLE------EDAYWVQLDLHFPPGLSFRKVEMLK
790 800 810 820 830
690 700 710 720 730
pF1KE2 P----PGACQA--------NETIFCELGNP-FKRNQRMELLITFEVIGVTLHTRDLQVQL
: : .:. .... :....: :: .. . : . :...
CCDS32 PHSQIPVSCEELPEESRLLSRALSCNVSSPIFKAGHSVALQMMFNTLVNSSWGDSVELHA
840 850 860 870 880 890
740 750 760 770 780 790
pF1KE2 QLSTSSHQDNLWPMILTLLVDYTLQTSLSMVNHRLQSFFGGTVMGESGMKTVEDVGSPLK
CCDS32 NVTCNNEDSDLLEDNSATTIIPILYPINILIQDQEDSTLYVSFTPKGPKIHQVKHMYQVR
900 910 920 930 940 950
1051 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 13:47:19 2016 done: Sun Nov 6 13:47:19 2016
Total Scan time: 4.130 Total Display time: 0.430
Function used was FASTA [36.3.4 Apr, 2011]