FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB9778, 798 aa
1>>>pF1KB9778 798 - 798 aa - 798 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.7801+/-0.00137; mu= 14.9600+/- 0.082
mean_var=180.1803+/-35.287, 0's: 0 Z-trim(106.1): 136 B-trim: 37 in 2/47
Lambda= 0.095548
statistics sampled from 8665 (8798) to 8665 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.618), E-opt: 0.2 (0.27), width: 16
Scan time: 3.830
The best scores are: opt bits E(32554)
CCDS7174.1 ITGB1 gene_id:3688|Hs108|chr10 ( 798) 5589 784.1 0
CCDS11511.1 ITGB3 gene_id:3690|Hs108|chr17 ( 788) 2408 345.6 1.9e-94
CCDS3030.1 ITGB5 gene_id:3693|Hs108|chr3 ( 799) 2309 332.0 2.4e-90
CCDS8849.1 ITGB7 gene_id:3695|Hs108|chr12 ( 798) 2226 320.5 6.7e-87
CCDS13716.1 ITGB2 gene_id:3689|Hs108|chr21 ( 769) 2009 290.6 6.6e-78
CCDS74596.1 ITGB6 gene_id:3694|Hs108|chr2 ( 746) 1877 272.4 1.9e-72
CCDS2212.1 ITGB6 gene_id:3694|Hs108|chr2 ( 788) 1877 272.4 2e-72
CCDS74597.1 ITGB6 gene_id:3694|Hs108|chr2 ( 693) 1804 262.3 2e-69
CCDS63040.1 ITGB6 gene_id:3694|Hs108|chr2 ( 681) 1695 247.3 6.5e-65
CCDS58599.1 ITGB4 gene_id:3691|Hs108|chr17 (1752) 1515 222.9 3.5e-57
CCDS32736.1 ITGB4 gene_id:3691|Hs108|chr17 (1805) 1515 222.9 3.6e-57
CCDS11727.1 ITGB4 gene_id:3691|Hs108|chr17 (1822) 1515 223.0 3.6e-57
CCDS5370.1 ITGB8 gene_id:3696|Hs108|chr7 ( 769) 1101 165.4 3.1e-40
CCDS9499.1 ITGBL1 gene_id:9358|Hs108|chr13 ( 494) 481 79.8 1.3e-14
CCDS61361.1 ITGBL1 gene_id:9358|Hs108|chr13 ( 401) 465 77.4 5.1e-14
>>CCDS7174.1 ITGB1 gene_id:3688|Hs108|chr10 (798 aa)
initn: 5589 init1: 5589 opt: 5589 Z-score: 4179.0 bits: 784.1 E(32554): 0
Smith-Waterman score: 5589; 100.0% identity (100.0% similar) in 798 aa overlap (1-798:1-798)
10 20 30 40 50 60
pF1KB9 MNLQPIFWIGLISSVCCVFAQTDENRCLKANAKSCGECIQAGPNCGWCTNSTFLQEGMPT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 MNLQPIFWIGLISSVCCVFAQTDENRCLKANAKSCGECIQAGPNCGWCTNSTFLQEGMPT
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB9 SARCDDLEALKKKGCPPDDIENPRGSKDIKKNKNVTNRSKGTAEKLKPEDITQIQPQQLV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 SARCDDLEALKKKGCPPDDIENPRGSKDIKKNKNVTNRSKGTAEKLKPEDITQIQPQQLV
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB9 LRLRSGEPQTFTLKFKRAEDYPIDLYYLMDLSYSMKDDLENVKSLGTDLMNEMRRITSDF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 LRLRSGEPQTFTLKFKRAEDYPIDLYYLMDLSYSMKDDLENVKSLGTDLMNEMRRITSDF
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB9 RIGFGSFVEKTVMPYISTTPAKLRNPCTSEQNCTSPFSYKNVLSLTNKGEVFNELVGKQR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 RIGFGSFVEKTVMPYISTTPAKLRNPCTSEQNCTSPFSYKNVLSLTNKGEVFNELVGKQR
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB9 ISGNLDSPEGGFDAIMQVAVCGSLIGWRNVTRLLVFSTDAGFHFAGDGKLGGIVLPNDGQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 ISGNLDSPEGGFDAIMQVAVCGSLIGWRNVTRLLVFSTDAGFHFAGDGKLGGIVLPNDGQ
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB9 CHLENNMYTMSHYYDYPSIAHLVQKLSENNIQTIFAVTEEFQPVYKELKNLIPKSAVGTL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 CHLENNMYTMSHYYDYPSIAHLVQKLSENNIQTIFAVTEEFQPVYKELKNLIPKSAVGTL
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB9 SANSSNVIQLIIDAYNSLSSEVILENGKLSEGVTISYKSYCKNGVNGTGENGRKCSNISI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 SANSSNVIQLIIDAYNSLSSEVILENGKLSEGVTISYKSYCKNGVNGTGENGRKCSNISI
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB9 GDEVQFEISITSNKCPKKDSDSFKIRPLGFTEEVEVILQYICECECQSEGIPESPKCHEG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 GDEVQFEISITSNKCPKKDSDSFKIRPLGFTEEVEVILQYICECECQSEGIPESPKCHEG
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB9 NGTFECGACRCNEGRVGRHCECSTDEVNSEDMDAYCRKENSSEICSNNGECVCGQCVCRK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 NGTFECGACRCNEGRVGRHCECSTDEVNSEDMDAYCRKENSSEICSNNGECVCGQCVCRK
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB9 RDNTNEIYSGKFCECDNFNCDRSNGLICGGNGVCKCRVCECNPNYTGSACDCSLDTSTCE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 RDNTNEIYSGKFCECDNFNCDRSNGLICGGNGVCKCRVCECNPNYTGSACDCSLDTSTCE
550 560 570 580 590 600
610 620 630 640 650 660
pF1KB9 ASNGQICNGRGICECGVCKCTDPKFQGQTCEMCQTCLGVCAEHKECVQCRAFNKGEKKDT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 ASNGQICNGRGICECGVCKCTDPKFQGQTCEMCQTCLGVCAEHKECVQCRAFNKGEKKDT
610 620 630 640 650 660
670 680 690 700 710 720
pF1KB9 CTQECSYFNITKVESRDKLPQPVQPDPVSHCKEKDVDDCWFYFTYSVNGNNEVMVHVVEN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 CTQECSYFNITKVESRDKLPQPVQPDPVSHCKEKDVDDCWFYFTYSVNGNNEVMVHVVEN
670 680 690 700 710 720
730 740 750 760 770 780
pF1KB9 PECPTGPDIIPIVAGVVAGIVLIGLALLLIWKLLMIIHDRREFAKFEKEKMNAKWDTGEN
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS71 PECPTGPDIIPIVAGVVAGIVLIGLALLLIWKLLMIIHDRREFAKFEKEKMNAKWDTGEN
730 740 750 760 770 780
790
pF1KB9 PIYKSAVTTVVNPKYEGK
::::::::::::::::::
CCDS71 PIYKSAVTTVVNPKYEGK
790
>>CCDS11511.1 ITGB3 gene_id:3690|Hs108|chr17 (788 aa)
initn: 1701 init1: 479 opt: 2408 Z-score: 1809.3 bits: 345.6 E(32554): 1.9e-94
Smith-Waterman score: 2480; 45.1% identity (73.7% similar) in 778 aa overlap (25-797:29-787)
10 20 30 40 50
pF1KB9 MNLQPIFWIGLISSVCCVFAQTDENRCLKANAKSCGECIQAGPNCGWCTNSTFLQE
: : ...:: .:. ..: :.::.. :
CCDS11 MRARPRPRPLWATVLALGALAGVGVGGPNICTTRGVSSCQQCLAVSPMCAWCSD-----E
10 20 30 40 50
60 70 80 90 100 110
pF1KB9 GMPT-SARCDDLEALKKKGCPPDDIENPRGSKDIKKNKNVTNRSKGTAEKLKPEDITQIQ
..: : ::: : : : .: :..:: : . . ... ......: . . .::..
CCDS11 ALPLGSPRCDLKENLLKDNCAPESIEFPVSEARVLEDRPLSDKGSGDSSQ-----VTQVS
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB9 PQQLVLRLRSGEPQTFTLKFKRAEDYPIDLYYLMDLSYSMKDDLENVKSLGTDLMNEMRR
::...:::: . ..:... ...::::.:.:::::::::::::: ....::: : ..::.
CCDS11 PQRIALRLRPDDSKNFSIQVRQVEDYPVDIYYLMDLSYSMKDDLWSIQNLGTKLATQMRK
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB9 ITSDFRIGFGSFVEKTVMPYISTTPAK-LRNPCTSEQN-CTSPFSYKNVLSLTNKGEVFN
.::..:::::.::.: : ::. .: . :.::: . .. : :.::.::.::.. ::
CCDS11 LTSNLRIGFGAFVDKPVSPYMYISPPEALENPCYDMKTTCLPMFGYKHVLTLTDQVTRFN
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB9 ELVGKQRISGNLDSPEGGFDAIMQVAVCGSLIGWRN-VTRLLVFSTDAGFHFAGDGKLGG
: : :: .: : :.::::::::::..:: ::::: ...::::.::: :.: ::.:.:
CCDS11 EEVKKQSVSRNRDAPEGGFDAIMQATVCDEKIGWRNDASHLLVFTTDAKTHIALDGRLAG
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB9 IVLPNDGQCHL-ENNMYTMSHYYDYPSIAHLVQKLSENNIQTIFAVTEEFQPVYKELKNL
:: :::::::. .: :. : .::::.. ...:::..::. ::::::. .:.. ..:
CCDS11 IVQPNDGQCHVGSDNHYSASTTMDYPSLGLMTEKLSQKNINLIFAVTENVVNLYQNYSEL
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB9 IPKSAVGTLSANSSNVIQLIIDAYNSLSSEVILENGKLSEGVTISYKSYCKNGVNGTGEN
:: ..::.:: .::::.:::.:::... :.: :: : : ...:... : : : . .
CCDS11 IPGTTVGVLSMDSSNVLQLIVDAYGKIRSKVELEVRDLPEELSLSFNATCLN--NEVIPG
360 370 380 390 400
420 430 440 450 460 470
pF1KB9 GRKCSNISIGDEVQFEISITSNKCPKKDSDSFKIRPLGFTEEVEVILQYICECECQSEGI
..: ...::: :.: : ::.. :: :.:.:: . . : . . :.: ::...
CCDS11 LKSCMGLKIGDTVSFSIEAKVRGCPQEKEKSFTIKPVGFKDSLIVQVTFDCDCACQAQAE
410 420 430 440 450 460
480 490 500 510 520 530
pF1KB9 PESPKCHEGNGTFECGACRCNEGRVGRHCECSTDEVNSEDMDAYCRKENSSEICSNNGEC
:.: .:..::::::::.:::. : .: .:::: .. ..: : .... .::. :::
CCDS11 PNSHRCNNGNGTFECGVCRCGPGWLGSQCECSEEDYRPSQQDE-CSPREGQPVCSQRGEC
470 480 490 500 510 520
540 550 560 570 580 590
pF1KB9 VCGQCVCRKRDNTNEIYSGKFCECDNFNCDRSNGLICGGNGVCKCRVCECNPNYTGSACD
.::::::.. : ..: .::.::::.:.: : .: .:.:.: :.: : :. ..:: :.
CCDS11 LCGQCVCHSSD-FGKI-TGKYCECDDFSCVRYKGEMCSGHGQCSCGDCLCDSDWTGYYCN
530 540 550 560 570 580
600 610 620 630 640 650
pF1KB9 CSLDTSTCEASNGQICNGRGICECGVCKCTDPKFQGQTCEMCQTCLGVCAEHKECVQCRA
:. :.:: .::: .:.::: :::: : : .: :.::: : :: .:. .::::.:.
CCDS11 CTTRTDTCMSSNGLLCSGRGKCECGSCVCIQPGSYGDTCEKCPTCPDACTFKKECVECKK
590 600 610 620 630 640
660 670 680 690 700 710
pF1KB9 FNKGEKKDTCTQECSYFNITKVESRDKLPQPVQPDPVSHCKEKDVDDCWFYFTYSVNGNN
:..: .: : :. . ..:: .: . . : :. : :. ::: : : ....
CCDS11 FDRGALHDENT--CNRYCRDEIESVKEL-KDTGKDAVN-CTYKNEDDCVVRFQYYEDSSG
650 660 670 680 690 700
720 730 740 750 760 770
pF1KB9 EVMVHVVENPECPTGPDIIPIVAGVVAGIVLIGLALLLIWKLLMIIHDRREFAKFEKEKM
. ...:::.:::: ::::. .. .:...:.::::: :::::::. ::::.::::::.:.
CCDS11 KSILYVVEEPECPKGPDILVVLLSVMGAILLIGLAALLIWKLLITIHDRKEFAKFEEERA
710 720 730 740 750 760
780 790
pF1KB9 NAKWDTGENPIYKSAVTTVVNPKYEGK
:::::..::.:: :..: .: :.:
CCDS11 RAKWDTANNPLYKEATSTFTNITYRGT
770 780
>>CCDS3030.1 ITGB5 gene_id:3693|Hs108|chr3 (799 aa)
initn: 1489 init1: 468 opt: 2309 Z-score: 1735.5 bits: 332.0 E(32554): 2.4e-90
Smith-Waterman score: 2309; 43.7% identity (71.0% similar) in 775 aa overlap (25-789:26-780)
10 20 30 40 50
pF1KB9 MNLQPIFWIGLISSVCCVFAQTDENRCLKANAKSCGECIQAGPNCGWCTNSTFLQEGMP
: : ...: :: ::. :.:.::.. : : :
CCDS30 MPRAPAPLYACLLGLCALLPRLAGLNICTSGSATSCEECLLIHPKCAWCSKEDF---GSP
10 20 30 40 50
60 70 80 90 100 110
pF1KB9 TS--ARCDDLEALKKKGCPPDDIENPRGSKDIKKNKNVTNRSKGTAEKLKPEDITQIQPQ
: .::: : :.:: .::.: .: . .. ......:.: :. :. ::
CCDS30 RSITSRCDLRANLVKNGCG-GEIESPASSFHVLRSLPLSSKGSGSA----GWDVIQMTPQ
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB9 QLVLRLRSGEPQTFTLKFKRAEDYPIDLYYLMDLSYSMKDDLENVKSLGTDLMNEMRRIT
.... :: :. :: :. ...::::.::::::::: ::::::.:..:::: : .:::..:
CCDS30 EIAVNLRPGDKTTFQLQVRQVEDYPVDLYYLMDLSLSMKDDLDNIRSLGTKLAEEMRKLT
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB9 SDFRIGFGSFVEKTVMPYISTTPAKLRNPCTSEQ---NCTSPFSYKNVLSLTNKGEVFNE
:.::.::::::.: . :. :.: ::: . . ::. :.....: ::.. . :::
CCDS30 SNFRLGFGSFVDKDISPFSYTAPRYQTNPCIGYKLFPNCVPSFGFRHLLPLTDRVDSFNE
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB9 LVGKQRISGNLDSPEGGFDAIMQVAVCGSLIGWR-NVTRLLVFSTDAGFHFAGDGKLGGI
: :::.: : :.:::::::..:.::: :::: .. .::::.:: :.: ::::::.
CCDS30 EVRKQRVSRNRDAPEGGFDAVLQAAVCKEKIGWRKDALHLLVFTTDDVPHIALDGKLGGL
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB9 VLPNDGQCHL-ENNMYTMSHYYDYPSIAHLVQKLSENNIQTIFAVTEEFQPVYKELKNLI
: :.:::::: : : :: :. .::::.: : .::.::::. :::::.. .::.. ::
CCDS30 VQPHDGQCHLNEANEYTASNQMDYPSLALLGEKLAENNINLIFAVTKNHYMLYKNFTALI
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB9 PKSAVGTLSANSSNVIQLIIDAYNSLSSEVILENGKLSEGVTISYKSYCKNGVNGTGENG
: ..: :...:.:.:::::.::::. :.: : : ... . . :..::. :.
CCDS30 PGTTVEILDGDSKNIIQLIINAYNSIRSKVELSVWDQPEDLNLFFTATCQDGVSYPGQ--
360 370 380 390 400 410
420 430 440 450 460 470
pF1KB9 RKCSNISIGDEVQFEISITSNKCPKKDSDS-FKIRPLGFTEEVEVILQYICECECQSEGI
::: ...::: ..::.:. . .::.. .. : .::.:: . .:: . : : : : : :.
CCDS30 RKCEGLKIGDTASFEVSLEARSCPSRHTEHVFALRPVGFRDSLEVGVTYNCTCGC-SVGL
420 430 440 450 460
480 490 500 510 520 530
pF1KB9 -PESPKCHEGNGTFECGACRCNEGRVGRHCECSTDEVNSEDMDAYCRKENSSEICSNNGE
:.: .:. :.::. :: :.:. : .: .:::. : :. .. ::. ... .::. :.
CCDS30 EPNSARCN-GSGTYVCGLCECSPGYLGTRCECQDGE-NQSVYQNLCREAEGKPLCSGRGD
470 480 490 500 510 520
540 550 560 570 580 590
pF1KB9 CVCGQCVCRKRDNTNEIYSGKFCECDNFNCDRSNGLICGGNGVCKCRVCECNPNYTGSAC
: :.:: : . . ..:: : :::::::.: :..:..:.:.: :.: :.:. .: :. :
CCDS30 CSCNQCSCFESE-FGKIY-GPFCECDNFSCARNKGVLCSGHGECHCGECKCHAGYIGDNC
530 540 550 560 570 580
600 610 620 630 640 650
pF1KB9 DCSLDTSTCEASNGQICNGRGICECGVCKCTDPKFQGQTCEMCQTCLGVCAEHKECVQCR
.:: : :::.. .::::. :: : :: :.::.: :. :: : :: .:. ...::.:
CCDS30 NCSTDISTCRGRDGQICSERGHCLCGQCQCTEPGAFGEMCEKCPTCPDACSTKRDCVECL
590 600 610 620 630 640
660 670 680 690 700
pF1KB9 AFNKGEKKD-TCTQECSYFNITKVESRDKLPQPVQPDPVSHCKEKDVDDCWFYFTYSVNG
...:. . :: . : :: :.. : : . : : . :: ..:::
CCDS30 LLHSGKPDNQTCHSLCRDEVITWVDTIVKDDQE-----AVLCFYKTAKDCVMMFTYVELP
650 660 670 680 690 700
710 720 730 740 750 760
pF1KB9 NNEVMVHVVENPECPTGPDIIPIVAGVVAGIVLIGLALLLIWKLLMIIHDRREFAKFEKE
... . :...::: . :. . :. .::..:.:.::::: :::::. ::::::::::..:
CCDS30 SGKSNLTVLREPECGNTPNAMTILLAVVGSILLVGLALLAIWKLLVTIHDRREFAKFQSE
710 720 730 740 750 760
770 780 790
pF1KB9 KMNAKWDTGENPIYKSAVTTVVNPKYEGK
. :... . ::.:.. ..:
CCDS30 RSRARYEMASNPLYRKPISTHTVDFTFNKFNKSYNGTVD
770 780 790
>>CCDS8849.1 ITGB7 gene_id:3695|Hs108|chr12 (798 aa)
initn: 2029 init1: 506 opt: 2226 Z-score: 1673.6 bits: 320.5 E(32554): 6.7e-87
Smith-Waterman score: 2477; 45.0% identity (72.9% similar) in 771 aa overlap (32-796:48-791)
10 20 30 40 50 60
pF1KB9 NLQPIFWIGLISSVCCVFAQTDENRCLKANAKSCGECIQAGPNCGWCTNSTFLQEGMPTS
: :: .:: . :.:.:: . .: : .
CCDS88 ESELDAKIPSTGDATEWRNPHLSMLGSCQPAPSCQKCILSHPSCAWCKQLNFTASGEAEA
20 30 40 50 60 70
70 80 90 100 110 120
pF1KB9 ARCDDLEALKKKGCPPDDIENPRGSKDIKKNKNVTNRSKGTAEKLKPEDITQIQPQQLVL
:: : : .::: ...:.:::.... ... ... ..: : ::. ::.. .
CCDS88 RRCARREELLARGCPLEELEEPRGQQEVLQDQPLSQGARG-------EGATQLAPQRVRV
80 90 100 110 120 130
130 140 150 160 170 180
pF1KB9 RLRSGEPQTFTLKFKRAEDYPIDLYYLMDLSYSMKDDLENVKSLGTDLMNEMRRITSDFR
:: :::: . ..: ::: ::.::::::::::::::::: :..:: :. .....: . :
CCDS88 TLRPGEPQQLQVRFLRAEGYPVDLYYLMDLSYSMKDDLERVRQLGHALLVRLQEVTHSVR
140 150 160 170 180 190
190 200 210 220 230 240
pF1KB9 IGFGSFVEKTVMPYISTTPAKLRNPCTSE-QNCTSPFSYKNVLSLTNKGEVFNELVGKQR
:::::::.:::.:..::.:.:::.:: .. . : ::::...:::::. ...:.. ::.:
CCDS88 IGFGSFVDKTVLPFVSTVPSKLRHPCPTRLERCQSPFSFHHVLSLTGDAQAFEREVGRQS
200 210 220 230 240 250
250 260 270 280 290 300
pF1KB9 ISGNLDSPEGGFDAIMQVAVCGSLIGWRNVTRLLVFSTDAGFHFAGDGKLGGIVLPNDGQ
.::::::::::::::.:.:.: ::::::.:::::..: :: ::::::::: .:.::.
CCDS88 VSGNLDSPEGGFDAILQAALCQEQIGWRNVSRLLVFTSDDTFHTAGDGKLGGIFMPSDGH
260 270 280 290 300 310
310 320 330 340 350
pF1KB9 CHLENN-MYTMSHYYDYPSIAHLVQKLSENNIQTIFAVTEEFQPVYKELKNLIPKSAVGT
:::..: .:. : .::::.....: :: ::: ::::: :::.::..::::::::
CCDS88 CHLDSNGLYSRSTEFDYPSVGQVAQALSAANIQPIFAVTSAALPVYQELSKLIPKSAVGE
320 330 340 350 360 370
360 370 380 390 400 410
pF1KB9 LSANSSNVIQLIIDAYNSLSSEVILENGKLSEGVTISYKSYCKNGVN--GTGENGRKCSN
:: .::::.:::.:::::::: : ::...: :: :::.: :.. . : .:. .:..
CCDS88 LSEDSSNVVQLIMDAYNSLSSTVTLEHSSLPPGVHISYESQCEGPEKREGKAEDRGQCNH
380 390 400 410 420 430
420 430 440 450 460 470
pF1KB9 ISIGDEVQFEISITSNKC-PKKDSDSFKIRPLGFTEEVEVILQYICECECQSEGIPESPK
. :.. : : .:. ...: : . ...: :::.::. : :. .:.:.: :. :..:.
CCDS88 VRINQTVTFWVSLQATHCLP--EPHLLRLRALGFSEELIVELHTLCDCNC-SDTQPQAPH
440 450 460 470 480
480 490 500 510 520 530
pF1KB9 CHEGNGTFECGACRCNEGRVGRHCECSTDEVNSEDMDAYCRKENSS-EICSNNGECVCGQ
: .:.: ..::.: : ::.:: ::::. :..: :... :: :.. .::..:.: ::.
CCDS88 CSDGQGHLQCGVCSCAPGRLGRLCECSVAELSSPDLESGCRAPNGTGPLCSGKGHCQCGR
490 500 510 520 530 540
540 550 560 570 580 590
pF1KB9 CVCRKRDNTNEIYSGKFCECDNFNCDRSNGLICGGNGVCKCRVCECNPNYTGSACDCSLD
: : .. ::..::::. .:.: .:..::: : :.: ::.:. : :: ::.:: :
CCDS88 CSCSGQS------SGHLCECDDASCERHEGILCGGFGRCQCGVCHCHANRTGRACECSGD
550 560 570 580 590 600
600 610 620 630 640 650
pF1KB9 TSTCEASNGQICNGRGICECGVCKCTDPKFQGQTCEMCQTCLGVCAEHKECVQCRAFNKG
..: . .: .:.:.: :.:. :.: : . : :..: : : .:..:..: :: :
CCDS88 MDSCISPEGGLCSGHGRCKCNRCQCLDG-YYGALCDQCPGCKTPCERHRDCAECGAFRTG
610 620 630 640 650 660
660 670 680 690 700 710
pF1KB9 EKKDTCTQECSYFNITKVESRDKLPQPVQPDPVSHCKEKDVDDCWFYFTYSVNGNNEVMV
.:. :.. :.: . . :. : . :::. .:. :.: .. . :..
CCDS88 PLATNCSTACAHTNVTLALA------PILDD--GWCKERTLDNQLFFFLVEDDARGTVVL
670 680 690 700 710
720 730 740 750 760 770
pF1KB9 HVVENPECPTGPDIIPIVAGVVAGIVLIGLALLLIWKLLMIIHDRREFAKFEKEKMNAKW
.: :. . :: : :.::: .::.:.: ..: . :.::::...::::... .:
CCDS88 RV--RPQEKGADHTQAIVLGCVGGIVAVGLGLVLAYRLSVEIYDRREYSRFEKEQQQLNW
720 730 740 750 760 770
780 790
pF1KB9 DTGENPIYKSAVTTVVNPKYEGK
::.::::.::..::...
CCDS88 KQDSNPLYKSAITTTINPRFQEADSPTL
780 790
>>CCDS13716.1 ITGB2 gene_id:3689|Hs108|chr21 (769 aa)
initn: 2051 init1: 885 opt: 2009 Z-score: 1512.2 bits: 290.6 E(32554): 6.6e-78
Smith-Waterman score: 2541; 45.6% identity (73.2% similar) in 801 aa overlap (1-795:2-766)
10 20 30 40 50
pF1KB9 MNLQP--IFWIGLISSVCCVFAQTDENRCLKANAKSCGECIQAGPNCGWCTNSTFLQEG
..:.: . .::.: . ::..: .: : ...:: :::..::.: :: . .: :
CCDS13 MLGLRPPLLALVGLLS-LGCVLSQ----ECTKFKVSSCRECIESGPGCTWCQKLNFTGPG
10 20 30 40 50
60 70 80 90 100 110
pF1KB9 MPTSARCDDLEALKKKGCPPDDIENPRGSKDIKKNKNVTNRSKGTAEKLKPEDITQIQPQ
: : ::: : .:: ::: .: . . ....: .. :..::
CCDS13 DPDSIRCDTRPQLLMRGCAADDIMDPTSLAETQEDHNGGQK--------------QLSPQ
60 70 80 90 100
120 130 140 150 160 170
pF1KB9 QLVLRLRSGEPQTFTLKFKRAEDYPIDLYYLMDLSYSMKDDLENVKSLGTDLMNEMRRIT
...: :: :. .:.. :.::. ::::::::::::::: :::.:::.:: ::. . .::
CCDS13 KVTLYLRPGQAAAFNVTFRRAKGYPIDLYYLMDLSYSMLDDLRNVKKLGGDLLRALNEIT
110 120 130 140 150 160
180 190 200 210 220 230
pF1KB9 SDFRIGFGSFVEKTVMPYISTTPAKLRNPCTS-EQNCTSPFSYKNVLSLTNKGEVFNELV
. ::::::::.:::.:...: : :::::: . :..: ::....::.:::... :. :
CCDS13 ESGRIGFGSFVDKTVLPFVNTHPDKLRNPCPNKEKECQPPFAFRHVLKLTNNSNQFQTEV
170 180 190 200 210 220
240 250 260 270 280 290
pF1KB9 GKQRISGNLDSPEGGFDAIMQVAVCGSLIGWRNVTRLLVFSTDAGFHFAGDGKLGGIVLP
::: ::::::.::::.::.::::.: ::::::::::::.:: :::::::::::.:. :
CCDS13 GKQLISGNLDAPEGGLDAMMQVAACPEEIGWRNVTRLLVFATDDGFHFAGDGKLGAILTP
230 240 250 260 270 280
300 310 320 330 340 350
pF1KB9 NDGQCHLENNMYTMSHYYDYPSIAHLVQKLSENNIQTIFAVTEEFQPVYKELKNLIPKSA
:::.::::.:.: :. .::::...:..::.::::: ::::: .. .:..: ..:::::
CCDS13 NDGRCHLEDNLYKRSNEFDYPSVGQLAHKLAENNIQPIFAVTSRMVKTYEKLTEIIPKSA
290 300 310 320 330 340
360 370 380 390 400 410
pF1KB9 VGTLSANSSNVIQLIIDAYNSLSSEVILENGKLSEGVTISYKSYCKNGVNGTGENGRKCS
:: :: .::::..:: .:::.:::.:.:... : . . ..: :.:.:::. .. :.
CCDS13 VGELSEDSSNVVHLIKNAYNKLSSRVFLDHNALPDTLKVTYDSFCSNGVTHRNQPRGDCD
350 360 370 380 390 400
420 430 440 450 460 470
pF1KB9 NISIGDEVQFEISITSNKCPKKDSDSFKIRPLGFTEEVEVILQYICECECQSEGIPESPK
...:. . :....:...: ...: : :: ::::. : : . :::.:.... .:
CCDS13 GVQINVPITFQVKVTATECIQEQS--FVIRALGFTDIVTVQVLPQCECRCRDQSRDRS-L
410 420 430 440 450
480 490 500 510 520 530
pF1KB9 CHEGNGTFECGACRCNEGRVGRHCECSTDEVNSEDMDAYCRKENSSEICSNNGECVCGQC
:: :.: .::: :::. : .:..:::.:. .:..... :::.:.: :::. :.::::::
CCDS13 CH-GKGFLECGICRCDTGYIGKNCECQTQGRSSQELEGSCRKDNNSIICSGLGDCVCGQC
460 470 480 490 500 510
540 550 560 570 580 590
pF1KB9 VCRKRDNTNEIYSGKFCECDNFNCDRSNGLICGG--NGVCKCRVCECNPNYTGSACDCSL
.:. : ... :..::::..::.: :: .::: :.: : :.:.:.. ::::.:
CCDS13 LCHTSDVPGKLIYGQYCECDTINCERYNGQVCGGPGRGLCFCGKCRCHPGFEGSACQCER
520 530 540 550 560 570
600 610 620 630 640 650
pF1KB9 DTSTCEASNGQICNGRGICECGVCKCTDPKFQGQTCEMCQTCLGVCAEHKECVQCRAFNK
: : :.::: :.:.::.: . .: :. : : . :... :..: :.:
CCDS13 TTEGCLNPRRVECSGRGRCRCNVCECHSG-YQLPLCQECPGCPSPCGKYISCAECLKFEK
580 590 600 610 620 630
660 670 680 690 700 710
pF1KB9 GEKKDTCTQECSYFNITKVESRDKLPQPVQPDPVSHCKEKDVDDCWFYFTY-SVNGNNEV
: .:. : ..... .::. :::.: . :: .: . .: ..
CCDS13 GPFGKNCSAACPGLQLSN--------NPVKG---RTCKERDSEGCWVAYTLEQQDGMDRY
640 650 660 670 680
720 730 740 750 760 770
pF1KB9 MVHVVENPECPTGPDIIPIVAGVVAGIVLIGLALLLIWKLLMIIHDRREFAKFEKEKMNA
...: :. :: .::.: ::.:.::::::::. ::.::: :. . : ::. .:::::...
CCDS13 LIYVDESRECVAGPNIAAIVGGTVAGIVLIGILLLVIWKALIHLSDLREYRRFEKEKLKS
690 700 710 720 730 740
780 790
pF1KB9 KWDTGENPIYKSAVTTVVNPKYEGK
.:.. .::..:::.:::.:::.
CCDS13 QWNN-DNPLFKSATTTVMNPKFAES
750 760
>>CCDS74596.1 ITGB6 gene_id:3694|Hs108|chr2 (746 aa)
initn: 1429 init1: 473 opt: 1877 Z-score: 1414.0 bits: 272.4 E(32554): 1.9e-72
Smith-Waterman score: 2250; 43.2% identity (71.9% similar) in 740 aa overlap (63-798:16-735)
40 50 60 70 80 90
pF1KB9 KSCGECIQAGPNCGWCTNSTFLQEGMPTSARCDDLEALKKKGCPPDDIENPRGSKDIKKN
::: : ::: . :::: .. .: ::
CCDS74 MITYKNFTHPSGVGERCDTPANLLAKGCQLNFIENPVSQVEILKN
10 20 30 40
100 110 120 130 140 150
pF1KB9 KNVT-NRSKGTAEKLKPEDITQIQPQQLVLRLRSGEPQTFTLKFKRAEDYPIDLYYLMDL
: .. .:.:... ::.:: ::.:.:.:: : ::. .. ...::::.::::::::
CCDS74 KPLSVGRQKNSS------DIVQIAPQSLILKLRPGGAQTLQVHVRQTEDYPVDLYYLMDL
50 60 70 80 90
160 170 180 190 200 210
pF1KB9 SYSMKDDLENVKSLGTDLMNEMRRITSDFRIGFGSFVEKTVMPYISTTPAKLRNPCTS-E
: :: :::...: ::. : .:: ..::.::.:::::::: : :...::: .. :::.:
CCDS74 SASMDDDLNTIKELGSRLSKEMSKLTSNFRLGFGSFVEKPVSPFVKTTPEEIANPCSSIP
100 110 120 130 140 150
220 230 240 250 260 270
pF1KB9 QNCTSPFSYKNVLSLTNKGEVFNELVGKQRISGNLDSPEGGFDAIMQVAVCGSLIGWRNV
: :..:..: ::: .: :::.: .:.::.:.:.::::::::::.::: :::::
CCDS74 YFCLPTFGFKHILPLTNDAERFNEIVKNQKISANIDTPEGGFDAIMQAAVCKEKIGWRND
160 170 180 190 200 210
280 290 300 310 320
pF1KB9 T-RLLVFSTDAGFHFAGDGKLGGIVLPNDGQCHLEN-NMYTMSHYYDYPSIAHLVQKLSE
. .:::: .:: ::. :.::.:::.:::: :::.. : :.:: .::.:..:..:: .
CCDS74 SLHLLVFVSDADSHFGMDSKLAGIVIPNDGLCHLDSKNEYSMSTVLEYPTIGQLIDKLVQ
220 230 240 250 260 270
330 340 350 360 370 380
pF1KB9 NNIQTIFAVTEEFQPVYKELKNLIPKSAVGTLSANSSNVIQLIIDAYNSLSSEVILENGK
::. :::::.: .:.. .::: ..:: :. .:.:..::::.::. : ::: ::
CCDS74 NNVLLIFAVTQEQVHLYENYAKLIPGATVGLLQKDSGNILQLIISAYEELRSEVELEVLG
280 290 300 310 320 330
390 400 410 420 430 440
pF1KB9 LSEGVTISYKSYCKNGVNGTGENGRKCSNISIGDEVQFEISITSNKCPKKDSDSFKIRPL
.::...:. . :.::. .. .:::....:: ..: .... .: .. : . :.:.
CCDS74 DTEGLNLSFTAICNNGT--LFQHQKKCSHMKVGDTASFSVTVNIPHCERR-SRHIIIKPV
340 350 360 370 380 390
450 460 470 480 490 500
pF1KB9 GFTEEVEVILQYICECECQSEGIPESPKCHEGNGTFECGACRCNEGRVGRHCECSTDEVN
:. . .:.... :.:.::.: .: :::.:::.:.::.: :. :..: .:::. : ..
CCDS74 GLGDALELLVSPECNCDCQKEVEVNSSKCHHGNGSFQCGVCACHPGHMGPRCECGEDMLS
400 410 420 430 440 450
510 520 530 540 550 560
pF1KB9 SEDMDAYCRKENSSEICSNNGECVCGQCVCRKRDNTNEIYSGKFCECDNFNCDRSNGLIC
... :.. . ::. :.: ::::.:. : :: : .:.::::.: : .::.:
CCDS74 TDS----CKEAPDHPSCSGRGDCYCGQCICHLSPYGN-IY-GPYCQCDNFSCVRHKGLLC
460 470 480 490 500 510
570 580 590 600 610 620
pF1KB9 GGNGVCKCRVCECNPNYTGSACDCSLDTSTCEASNGQICNGRGICECGVCKCTDPKFQGQ
:::: : : : : ..:: :.:. .:..: . .: .:.::: : :: : ::.: .:
CCDS74 GGNGDCDCGECVCRSGWTGEYCNCTTSTDSCVSEDGVLCSGRGDCVCGKCVCTNPGASGP
520 530 540 550 560 570
630 640 650 660 670 680
pF1KB9 TCEMCQTCLGVCAEHKECVQCRAFNKGEKKDTCTQECSYFNITKVESRDKLPQPVQPDPV
::: : :: : .. :..:. :. .. :...:. . : : .: . :
CCDS74 TCERCPTCGDPCNSKRSCIECHLSAAGQAREECVDKCKLAGATISEEED-----FSKDGS
580 590 600 610 620
690 700 710 720 730 740
pF1KB9 SHCKEKDVDDCWFYFTYSVNGNNEVMVHVVENPECPTGPDIIPIVAGVVAGIVLIGLALL
:. . ..: . : ..........: ... .:: :.: :. :: .:.:::..::
CCDS74 VSCSLQGENECLITFLITTDNEGKTIIHSINEKDCPKPPNIPMIMLGVSLAILLIGVVLL
630 640 650 660 670 680
750 760 770 780 790
pF1KB9 LIWKLLMIIHDRREFAKFEKEKMNAKWDTGENPIYKSAVTTVVNPKYEGK
:::::. .:::.: :::: :. .:::.:: ::.:.....: : :. .
CCDS74 CIWKLLVSFHDRKEVAKFEAERSKAKWQTGTNPLYRGSTSTFKNVTYKHREKQKVDLSTD
690 700 710 720 730 740
CCDS74 C
>>CCDS2212.1 ITGB6 gene_id:3694|Hs108|chr2 (788 aa)
initn: 1429 init1: 473 opt: 1877 Z-score: 1413.7 bits: 272.4 E(32554): 2e-72
Smith-Waterman score: 2340; 42.5% identity (71.8% similar) in 776 aa overlap (27-798:23-777)
10 20 30 40 50 60
pF1KB9 MNLQPIFWIGLISSVCCVFAQTDENRCLKANAKSCGECIQAGPNCGWCTNSTFLQEGMPT
: ..:..: .:. ::.:.::.. .: . . .
CCDS22 MGIELLCLFFLFLGRNDHVQGGCALGGAETCEDCLLIGPQCAWCAQENFTHPS-GV
10 20 30 40 50
70 80 90 100 110
pF1KB9 SARCDDLEALKKKGCPPDDIENPRGSKDIKKNKNVT-NRSKGTAEKLKPEDITQIQPQQL
. ::: : ::: . :::: .. .: ::: .. .:.:... ::.:: ::.:
CCDS22 GERCDTPANLLAKGCQLNFIENPVSQVEILKNKPLSVGRQKNSS------DIVQIAPQSL
60 70 80 90 100
120 130 140 150 160 170
pF1KB9 VLRLRSGEPQTFTLKFKRAEDYPIDLYYLMDLSYSMKDDLENVKSLGTDLMNEMRRITSD
.:.:: : ::. .. ...::::.::::::::: :: :::...: ::. : .:: ..::.
CCDS22 ILKLRPGGAQTLQVHVRQTEDYPVDLYYLMDLSASMDDDLNTIKELGSRLSKEMSKLTSN
110 120 130 140 150 160
180 190 200 210 220 230
pF1KB9 FRIGFGSFVEKTVMPYISTTPAKLRNPCTS-EQNCTSPFSYKNVLSLTNKGEVFNELVGK
::.:::::::: : :...::: .. :::.: : :..:..: ::: .: :::.: .
CCDS22 FRLGFGSFVEKPVSPFVKTTPEEIANPCSSIPYFCLPTFGFKHILPLTNDAERFNEIVKN
170 180 190 200 210 220
240 250 260 270 280 290
pF1KB9 QRISGNLDSPEGGFDAIMQVAVCGSLIGWRNVT-RLLVFSTDAGFHFAGDGKLGGIVLPN
:.::.:.:.::::::::::.::: ::::: . .:::: .:: ::. :.::.:::.::
CCDS22 QKISANIDTPEGGFDAIMQAAVCKEKIGWRNDSLHLLVFVSDADSHFGMDSKLAGIVIPN
230 240 250 260 270 280
300 310 320 330 340 350
pF1KB9 DGQCHLEN-NMYTMSHYYDYPSIAHLVQKLSENNIQTIFAVTEEFQPVYKELKNLIPKSA
:: :::.. : :.:: .::.:..:..:: .::. :::::.: .:.. .::: ..
CCDS22 DGLCHLDSKNEYSMSTVLEYPTIGQLIDKLVQNNVLLIFAVTQEQVHLYENYAKLIPGAT
290 300 310 320 330 340
360 370 380 390 400 410
pF1KB9 VGTLSANSSNVIQLIIDAYNSLSSEVILENGKLSEGVTISYKSYCKNGVNGTGENGRKCS
:: :. .:.:..::::.::. : ::: :: .::...:. . :.::. .. .:::
CCDS22 VGLLQKDSGNILQLIISAYEELRSEVELEVLGDTEGLNLSFTAICNNGT--LFQHQKKCS
350 360 370 380 390 400
420 430 440 450 460 470
pF1KB9 NISIGDEVQFEISITSNKCPKKDSDSFKIRPLGFTEEVEVILQYICECECQSEGIPESPK
....:: ..: .... .: .. : . :.:.:. . .:.... :.:.::.: .: :
CCDS22 HMKVGDTASFSVTVNIPHCERR-SRHIIIKPVGLGDALELLVSPECNCDCQKEVEVNSSK
410 420 430 440 450 460
480 490 500 510 520 530
pF1KB9 CHEGNGTFECGACRCNEGRVGRHCECSTDEVNSEDMDAYCRKENSSEICSNNGECVCGQC
::.:::.:.::.: :. :..: .:::. : ..... :.. . ::. :.: ::::
CCDS22 CHHGNGSFQCGVCACHPGHMGPRCECGEDMLSTDS----CKEAPDHPSCSGRGDCYCGQC
470 480 490 500 510 520
540 550 560 570 580 590
pF1KB9 VCRKRDNTNEIYSGKFCECDNFNCDRSNGLICGGNGVCKCRVCECNPNYTGSACDCSLDT
.:. : :: : .:.::::.: : .::.::::: : : : : ..:: :.:. .:
CCDS22 ICHLSPYGN-IY-GPYCQCDNFSCVRHKGLLCGGNGDCDCGECVCRSGWTGEYCNCTTST
530 540 550 560 570 580
600 610 620 630 640 650
pF1KB9 STCEASNGQICNGRGICECGVCKCTDPKFQGQTCEMCQTCLGVCAEHKECVQCRAFNKGE
..: . .: .:.::: : :: : ::.: .: ::: : :: : .. :..:. :.
CCDS22 DSCVSEDGVLCSGRGDCVCGKCVCTNPGASGPTCERCPTCGDPCNSKRSCIECHLSAAGQ
590 600 610 620 630 640
660 670 680 690 700 710
pF1KB9 KKDTCTQECSYFNITKVESRDKLPQPVQPDPVSHCKEKDVDDCWFYFTYSVNGNNEVMVH
.. :...:. . : : .: . : :. . ..: . : ..........:
CCDS22 AREECVDKCKLAGATISEEED-----FSKDGSVSCSLQGENECLITFLITTDNEGKTIIH
650 660 670 680 690
720 730 740 750 760 770
pF1KB9 VVENPECPTGPDIIPIVAGVVAGIVLIGLALLLIWKLLMIIHDRREFAKFEKEKMNAKWD
... .:: :.: :. :: .:.:::..:: :::::. .:::.: :::: :. .:::.
CCDS22 SINEKDCPKPPNIPMIMLGVSLAILLIGVVLLCIWKLLVSFHDRKEVAKFEAERSKAKWQ
700 710 720 730 740 750
780 790
pF1KB9 TGENPIYKSAVTTVVNPKYEGK
:: ::.:.....: : :. .
CCDS22 TGTNPLYRGSTSTFKNVTYKHREKQKVDLSTDC
760 770 780
>>CCDS74597.1 ITGB6 gene_id:3694|Hs108|chr2 (693 aa)
initn: 719 init1: 473 opt: 1804 Z-score: 1360.0 bits: 262.3 E(32554): 2e-69
Smith-Waterman score: 2112; 43.3% identity (72.5% similar) in 676 aa overlap (126-798:21-682)
100 110 120 130 140 150
pF1KB9 TNRSKGTAEKLKPEDITQIQPQQLVLRLRSGEPQTFTLKFKRAEDYPIDLYYLMDLSYSM
: ::. .. ...::::.::::::::: ::
CCDS74 MGIELLCLFFLFLGRNDHVQGGAQTLQVHVRQTEDYPVDLYYLMDLSASM
10 20 30 40 50
160 170 180 190 200 210
pF1KB9 KDDLENVKSLGTDLMNEMRRITSDFRIGFGSFVEKTVMPYISTTPAKLRNPCTS-EQNCT
:::...: ::. : .:: ..::.::.:::::::: : :...::: .. :::.: :
CCDS74 DDDLNTIKELGSRLSKEMSKLTSNFRLGFGSFVEKPVSPFVKTTPEEIANPCSSIPYFCL
60 70 80 90 100 110
220 230 240 250 260 270
pF1KB9 SPFSYKNVLSLTNKGEVFNELVGKQRISGNLDSPEGGFDAIMQVAVCGSLIGWRNVT-RL
:..:..: ::: .: :::.: .:.::.:.:.::::::::::.::: ::::: . .:
CCDS74 PTFGFKHILPLTNDAERFNEIVKNQKISANIDTPEGGFDAIMQAAVCKEKIGWRNDSLHL
120 130 140 150 160 170
280 290 300 310 320 330
pF1KB9 LVFSTDAGFHFAGDGKLGGIVLPNDGQCHLEN-NMYTMSHYYDYPSIAHLVQKLSENNIQ
::: .:: ::. :.::.:::.:::: :::.. : :.:: .::.:..:..:: .::.
CCDS74 LVFVSDADSHFGMDSKLAGIVIPNDGLCHLDSKNEYSMSTVLEYPTIGQLIDKLVQNNVL
180 190 200 210 220 230
340 350 360 370 380 390
pF1KB9 TIFAVTEEFQPVYKELKNLIPKSAVGTLSANSSNVIQLIIDAYNSLSSEVILENGKLSEG
:::::.: .:.. .::: ..:: :. .:.:..::::.::. : ::: :: .::
CCDS74 LIFAVTQEQVHLYENYAKLIPGATVGLLQKDSGNILQLIISAYEELRSEVELEVLGDTEG
240 250 260 270 280 290
400 410 420 430 440 450
pF1KB9 VTISYKSYCKNGVNGTGENGRKCSNISIGDEVQFEISITSNKCPKKDSDSFKIRPLGFTE
...:. . :.::. .. .:::....:: ..: .... .: .. : . :.:.:. .
CCDS74 LNLSFTAICNNGT--LFQHQKKCSHMKVGDTASFSVTVNIPHCERR-SRHIIIKPVGLGD
300 310 320 330 340
460 470 480 490 500 510
pF1KB9 EVEVILQYICECECQSEGIPESPKCHEGNGTFECGACRCNEGRVGRHCECSTDEVNSEDM
.:.... :.:.::.: .: :::.:::.:.::.: :. :..: .:::. : .....
CCDS74 ALELLVSPECNCDCQKEVEVNSSKCHHGNGSFQCGVCACHPGHMGPRCECGEDMLSTDS-
350 360 370 380 390 400
520 530 540 550 560 570
pF1KB9 DAYCRKENSSEICSNNGECVCGQCVCRKRDNTNEIYSGKFCECDNFNCDRSNGLICGGNG
:.. . ::. :.: ::::.:. : :: : .:.::::.: : .::.:::::
CCDS74 ---CKEAPDHPSCSGRGDCYCGQCICHLSPYGN-IY-GPYCQCDNFSCVRHKGLLCGGNG
410 420 430 440 450 460
580 590 600 610 620 630
pF1KB9 VCKCRVCECNPNYTGSACDCSLDTSTCEASNGQICNGRGICECGVCKCTDPKFQGQTCEM
: : : : ..:: :.:. .:..: . .: .:.::: : :: : ::.: .: :::
CCDS74 DCDCGECVCRSGWTGEYCNCTTSTDSCVSEDGVLCSGRGDCVCGKCVCTNPGASGPTCER
470 480 490 500 510 520
640 650 660 670 680 690
pF1KB9 CQTCLGVCAEHKECVQCRAFNKGEKKDTCTQECSYFNITKVESRDKLPQPVQPDPVSHCK
: :: : .. :..:. :. .. :...:. . : : .: . : :.
CCDS74 CPTCGDPCNSKRSCIECHLSAAGQAREECVDKCKLAGATISEEED-----FSKDGSVSCS
530 540 550 560 570
700 710 720 730 740 750
pF1KB9 EKDVDDCWFYFTYSVNGNNEVMVHVVENPECPTGPDIIPIVAGVVAGIVLIGLALLLIWK
. ..: . : ..........: ... .:: :.: :. :: .:.:::..:: :::
CCDS74 LQGENECLITFLITTDNEGKTIIHSINEKDCPKPPNIPMIMLGVSLAILLIGVVLLCIWK
580 590 600 610 620 630
760 770 780 790
pF1KB9 LLMIIHDRREFAKFEKEKMNAKWDTGENPIYKSAVTTVVNPKYEGK
::. .:::.: :::: :. .:::.:: ::.:.....: : :. .
CCDS74 LLVSFHDRKEVAKFEAERSKAKWQTGTNPLYRGSTSTFKNVTYKHREKQKVDLSTDC
640 650 660 670 680 690
>>CCDS63040.1 ITGB6 gene_id:3694|Hs108|chr2 (681 aa)
initn: 1070 init1: 426 opt: 1695 Z-score: 1278.9 bits: 247.3 E(32554): 6.5e-65
Smith-Waterman score: 1784; 37.9% identity (63.8% similar) in 776 aa overlap (27-798:23-670)
10 20 30 40 50 60
pF1KB9 MNLQPIFWIGLISSVCCVFAQTDENRCLKANAKSCGECIQAGPNCGWCTNSTFLQEGMPT
: ..:..: .:. ::.:.::.. .: . . .
CCDS63 MGIELLCLFFLFLGRNDHVQGGCALGGAETCEDCLLIGPQCAWCAQENFTHPS-GV
10 20 30 40 50
70 80 90 100 110
pF1KB9 SARCDDLEALKKKGCPPDDIENPRGSKDIKKNKNVT-NRSKGTAEKLKPEDITQIQPQQL
. ::: : ::: . :::: .. .: ::: .. .:.:... ::.:: ::.:
CCDS63 GERCDTPANLLAKGCQLNFIENPVSQVEILKNKPLSVGRQKNSS------DIVQIAPQSL
60 70 80 90 100
120 130 140 150 160 170
pF1KB9 VLRLRSGEPQTFTLKFKRAEDYPIDLYYLMDLSYSMKDDLENVKSLGTDLMNEMRRITSD
.:.:: : ::. .. ...::::.::::::::: :: :::...: ::. : .:: ..::.
CCDS63 ILKLRPGGAQTLQVHVRQTEDYPVDLYYLMDLSASMDDDLNTIKELGSRLSKEMSKLTSN
110 120 130 140 150 160
180 190 200 210 220 230
pF1KB9 FRIGFGSFVEKTVMPYISTTPAKLRNPCTS-EQNCTSPFSYKNVLSLTNKGEVFNELVGK
::.:::::::: : :...::: .. :::.: : :..:..: ::: .: :::.: .
CCDS63 FRLGFGSFVEKPVSPFVKTTPEEIANPCSSIPYFCLPTFGFKHILPLTNDAERFNEIVKN
170 180 190 200 210 220
240 250 260 270 280 290
pF1KB9 QRISGNLDSPEGGFDAIMQVAVCGSLIGWRNVT-RLLVFSTDAGFHFAGDGKLGGIVLPN
:.::.:.:.::::::::::.::: ::::: . .:::: .:: ::. :.::.:::.::
CCDS63 QKISANIDTPEGGFDAIMQAAVCKEKIGWRNDSLHLLVFVSDADSHFGMDSKLAGIVIPN
230 240 250 260 270 280
300 310 320 330 340 350
pF1KB9 DGQCHLEN-NMYTMSHYYDYPSIAHLVQKLSENNIQTIFAVTEEFQPVYKELKNLIPKSA
:: :::.. : :.:: .::.:..:..:: .::. :::::.: .:.. .::: ..
CCDS63 DGLCHLDSKNEYSMSTVLEYPTIGQLIDKLVQNNVLLIFAVTQEQVHLYENYAKLIPGAT
290 300 310 320 330 340
360 370 380 390 400 410
pF1KB9 VGTLSANSSNVIQLIIDAYNSLSSEVILENGKLSEGVTISYKSYCKNGVNGTGENGRKCS
:: :. .:.:..::::.::. : ::: :: .::...:. . :.::. .. .:::
CCDS63 VGLLQKDSGNILQLIISAYEELRSEVELEVLGDTEGLNLSFTAICNNGT--LFQHQKKCS
350 360 370 380 390 400
420 430 440 450 460 470
pF1KB9 NISIGDEVQFEISITSNKCPKKDSDSFKIRPLGFTEEVEVILQYICECECQSEGIPESPK
....:: ..: .... .: .. : . :.:.:. . .:.... :.:.::.: .: :
CCDS63 HMKVGDTASFSVTVNIPHCERR-SRHIIIKPVGLGDALELLVSPECNCDCQKEVEVNSSK
410 420 430 440 450 460
480 490 500 510 520 530
pF1KB9 CHEGNGTFECGACRCNEGRVGRHCECSTDEVNSEDMDAYCRKENSSEICSNNGECVCGQC
::.:::.:.::.: :. :..: .:::. : ..... :.. . ::. :.: ::::
CCDS63 CHHGNGSFQCGVCACHPGHMGPRCECGEDMLSTDS----CKEAPDHPSCSGRGDCYCGQC
470 480 490 500 510 520
540 550 560 570 580 590
pF1KB9 VCRKRDNTNEIYSGKFCECDNFNCDRSNGLICGGNGVCKCRVCECNPNYTGSACDCSLDT
.:. : :: : .:.::::.: : .::.:: : : :
CCDS63 ICHLSPYGN-IY-GPYCQCDNFSCVRHKGLLCG---------------------DFSKD-
530 540 550
600 610 620 630 640 650
pF1KB9 STCEASNGQICNGRGICECGVCKCTDPKFQGQTCEMCQTCLGVCAEHKECVQCRAFNKGE
: .:. .::.
CCDS63 -------------------GSVSCS---LQGE----------------------------
560
660 670 680 690 700 710
pF1KB9 KKDTCTQECSYFNITKVESRDKLPQPVQPDPVSHCKEKDVDDCWFYFTYSVNGNNEVMVH
..: . : ..........:
CCDS63 ----------------------------------------NECLITFLITTDNEGKTIIH
570 580
720 730 740 750 760 770
pF1KB9 VVENPECPTGPDIIPIVAGVVAGIVLIGLALLLIWKLLMIIHDRREFAKFEKEKMNAKWD
... .:: :.: :. :: .:.:::..:: :::::. .:::.: :::: :. .:::.
CCDS63 SINEKDCPKPPNIPMIMLGVSLAILLIGVVLLCIWKLLVSFHDRKEVAKFEAERSKAKWQ
590 600 610 620 630 640
780 790
pF1KB9 TGENPIYKSAVTTVVNPKYEGK
:: ::.:.....: : :. .
CCDS63 TGTNPLYRGSTSTFKNVTYKHREKQKVDLSTDC
650 660 670 680
>>CCDS58599.1 ITGB4 gene_id:3691|Hs108|chr17 (1752 aa)
initn: 1353 init1: 342 opt: 1515 Z-score: 1140.0 bits: 222.9 E(32554): 3.5e-57
Smith-Waterman score: 1622; 36.7% identity (63.6% similar) in 774 aa overlap (4-752:5-734)
10 20 30 40 50
pF1KB9 MNLQPIFWIGLISS--VCCVFAQTDENRCLKANAKSCGECIQAGPNCGWCTNSTFLQEG
.: : :. . . .. : ::: :: .::: ::... .:..::. :
CCDS58 MAGPRPSPWARLLLAALISVSLSGTLANRCKKAPVKSCTECVRVDKDCAYCTDEMF----
10 20 30 40 50
60 70 80 90 100 110
pF1KB9 MPTSARCDDLEALKKKGCPPDDIENPRGSKDIKKNKNVTNRSKGTAEKLKPEDITQIQPQ
. ::. : :: ..: ..: .: .. .. . . . :..::
CCDS58 --RDRRCNTQAELLAAGCQRESIVVMESSFQITEETQIDTTLRRS----------QMSPQ
60 70 80 90 100
120 130 140 150 160 170
pF1KB9 QLVLRLRSGEPQTFTLKFKRAEDYPIDLYYLMDLSYSMKDDLENVKSLGTDLMNEMRRIT
: .::: :: . : :. . . :.::: :::.: ::.:::.:.:..: .: . ..:
CCDS58 GLRVRLRPGEERHFELEVFEPLESPVDLYILMDFSNSMSDDLDNLKKMGQNLARVLSQLT
110 120 130 140 150 160
180 190 200 210 220 230
pF1KB9 SDFRIGFGSFVEKTVMPYISTTPAKLRNPCTSEQNCTSPFSYKNVLSLTNKGEVF-NELV
::. ::::.::.:. .: . : ::..: : :::.:::.:::. . : :.:
CCDS58 SDYTIGFGKFVDKVSVPQTDMRPEKLKEP---WPNSDPPFSFKNVISLTEDVDEFRNKLQ
170 180 190 200 210 220
240 250 260 270 280 290
pF1KB9 GKQRISGNLDSPEGGFDAIMQVAVCGSLIGWR-NVTRLLVFSTDAGFHFAGDGK--LGGI
: .:::::::.::::::::.:.::: :::: . :.::::::...::. .:: :.::
CCDS58 G-ERISGNLDAPEGGFDAILQTAVCTRDIGWRPDSTHLLVFSTESAFHYEADGANVLAGI
230 240 250 260 270 280
300 310 320 330 340 350
pF1KB9 VLPNDGQCHLENN-MYTMSHYYDYPSIAHLVQKLSENNIQTIFAVTEEFQPVYKELKNLI
. :: .:::... ::. . ::::. ::. :...:: :::::. :..:.. .
CCDS58 MSRNDERCHLDTTGTYTQYRTQDYPSVPTLVRLLAKHNIIPIFAVTNYSYSYYEKLHTYF
290 300 310 320 330 340
360 370 380 390 400 410
pF1KB9 PKSAVGTLSANSSNVIQLIIDAYNSLSSEVILENGKLSEGVT--ISYKSYCKNGVNGTGE
: :..:.:. .:::...:. .:.: . :.. .. .:. .. : . : . ::
CCDS58 PVSSLGVLQEDSSNIVELLEEAFNRIRSNLDIRALDSPRGLRTEVTSKMFQK---TRTGS
350 360 370 380 390
420 430 440 450 460
pF1KB9 NGRKCSNISIGDEVQF---EISITSNKC--PKKDSDSFKIRPLGFTEEVEVILQYICE-C
. ....: .::. : .. : :. .. .....: .:.. ... ::. :
CCDS58 FHIRRGEVGIY-QVQLRALEHVDGTHVCQLPEDQKGNIHLKP-SFSDGLKMDAGIICDVC
400 410 420 430 440 450
470 480 490 500 510 520
pF1KB9 ECQSEGIPESPKCHEGNGTFECGACRCNEGRVGRHCECSTDEVNSEDMDAYCRKENSSEI
:. . .: .: :: : :: : :.:: :. :.::: .. :.. : .:. ..
CCDS58 TCELQKEVRSARCSF-NGDFVCGQCVCSEGWSGQTCNCSTGSLS--DIQP-CLREGEDKP
460 470 480 490 500 510
530 540 550 560 570 580
pF1KB9 CSNNGECVCGQCVCRKRDNTNEIYSGKFCECDNFNCDRSNGLICGGNGVCKCRVCECNPN
::. ::: ::.::: . : :.::: :::.: :..:..:. : :. : :.:.
CCDS58 CSGRGECQCGHCVCYGEGR----YEGQFCEYDNFQCPRTSGFLCNDRGRCSMGQCVCEPG
520 530 540 550 560
590 600 610 620 630 640
pF1KB9 YTGSACDCSLDTSTCEASNGQICNGRGICECGVCKCTDPKFQGQT-CEMCQTCL--GVCA
.:: .::: :...:: ::: :::::: :::: :.: . .. .: ::. . . :.:
CCDS58 WTGPSCDCPLSNATCIDSNGGICNGRGHCECGRCHCHQQSLYTDTICEINYSAIHPGLCE
570 580 590 600 610 620
650 660 670 680 690 700
pF1KB9 EHKECVQCRAFNKGEKKDTCTQECSYFNITKVESRDKLPQPVQPDPVSHCKEKDVDD-CW
. . ::::.:.. :::: .::.. ::. :.: . . : .:. .: :: :
CCDS58 DLRSCVQCQAWGTGEKKGRTCEECNF----KVKMVDELKRA--EEVVVRCSFRDEDDDCT
630 640 650 660 670 680
710 720 730 740 750
pF1KB9 FYFTYSVNG----NNEVMVHVVENPECPTGPD--IIPIVAGVVAGIVLIGLALLLIWKLL
. .:. .: :. :.:: .. .:: : .::.. .. :..: ::: ::
CCDS58 YSYTMEGDGAPGPNSTVLVH--KKKDCPPGSFWWLIPLLLLLLP---LLALLLLLCWKYC
690 700 710 720 730
760 770 780 790
pF1KB9 MIIHDRREFAKFEKEKMNAKWDTGENPIYKSAVTTVVNPKYEGK
CCDS58 ACCKACLALLPCCNRGHMVGFKEDHYMLRENLMASDHLDTPMLRSGNLKGRDVVRWKVTN
740 750 760 770 780 790
798 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 18:50:55 2016 done: Fri Nov 4 18:50:56 2016
Total Scan time: 3.830 Total Display time: 0.270
Function used was FASTA [36.3.4 Apr, 2011]